Friday, April 19, 2024

Bộ trợ giúp cá nhân Amazon Alexa và Google Home

Hà Dương Cự/Người Việt

Có khi nào bạn đi làm về mệt mỏi, chỉ mong muốn là ngồi xuống sa lông và ra lệnh “bia” là có bia mang tới không? Mong muốn này chẳng mấy chốc sẽ trở thành sự thật.

Trong mấy năm gần đây các công ty lớn về công nghệ thông tin như Google, Amazon, Samsung và Microsoft đang cạnh tranh nhau ráo riết trong thị trường rất nóng bây giờ. Đó là thị trường bộ trợ giúp cá nhân (personal assistant). Tôi xin nói về các bộ trợ giúp cá nhân trong bài này.

Bộ trợ giúp cá nhân hoạt động ra sao

Đa số bộ trợ giúp hoạt động bằng cách nghe mệnh lệnh hay câu hỏi bằng lời nói. Một khi bộ trợ giúp nghe và hiểu được mệnh lệnh truyền tới thì bộ trợ giúp dùng phần mềm và liên kết với mạng lưới thông tin toàn cầu (Internet) để thi hành mệnh lệnh hay tìm câu trả lời. Thí dụ bộ trợ giúp nhận được câu hỏi: “Thời tiết ngày mai ở Orange County ra sao?” thì nó tự động vào mạng tiên đoán thời tiết để biết thời tiết ngày mai ở Orange County và trả lời câu hỏi bằng lời nói.

Cái khó nhất là hiểu tiếng nói của người dùng. Bởi vì mỗi người có một cách và giọng nói khác nhau, không ai giống ai (ở đây tôi chỉ nói tới tiếng Mỹ chứ không bàn tới máy nhận tiếng Việt).

Nhận dạng tiếng nói (voice recognition)

Nhận và hiểu tiếng nói là vấn đề nan giải nhất trong công nghệ thông tin thời nay. Phần mềm nhận và hiểu tiếng nói đã được gài đặt vào nhiều điện thoại đa năng và máy tính, nhưng ngay cả người Mỹ cũng ít người dùng vì chưa được chính xác cho lắm. Bản thân tôi cũng không dùng những phần mềm này vì mình nói tiếng Mỹ với giọng Việt Nam nên máy không hiểu mình muốn nói gì.

Trong phần này tôi xin giải thích sơ qua về quá trình của hệ thống nhận dạng tiếng nói.

-Biến tiếng nói thành dữ liệu kỹ thuật số: Khi bạn nói thì những âm phát ra là những dao động trong không khí theo dạng sóng analog (analog wave). Máy vi âm chuyển tiếng nói thành tín hiệu analog (analog signal). Một bộ phận gọi là bộ chuyển đổi analog-số (analog-to-digital converter) biến đổi tín hiệu analog thành những dữ liệu số mà những thiết bị kỹ thuật số (digital device) hiểu được.

Sự biến đổi này được thực hiện bằng phương pháp lấy mẫu (sampling), tức là đo sóng trong mỗi một khoảng thời gian nhất định. Lấy mẫu càng nhiều thì càng chính xác. Âm nhạc số dạng mp3 lấy mẫu tới 44,000 lần một giây.

-Xử lý tiếng nói: Hệ thống nhận dạng tiếng nói đưa dữ liệu số của tiếng nói qua những quá trình như là loại bỏ nhiễu âm (noise), bình thường hóa tiếng nói vì có người nói to, có người nói nhỏ và có người nói nhanh, có người nói chậm.

-Hiểu tiếng nói: Sau đó dữ liệu số của tiếng nói được phân làm những đoạn rất nhỏ, một phần vài trăm của một giây. Những đoạn nhỏ ấy được đem so sánh với những mẫu âm có sẵn trong máy. Những mẫu ấy là gọi là đơn âm hay âm vị (phoneme). Tiếng Anh có trên 40 đơn âm.

Phần cuối cùng của hệ thống nhận dạng tiếng nói là ghép các đơn âm trên thành chữ và câu nói. Phần này rất là khó vì những phát âm khác nhau của nhiều người và có nhiều chữ đồng âm nhưng viết khác nhau và có nghĩa hoàn toàn khác, thí dụ “there” và “their.” Để có thể phân biệt hai chữ như trên, các hệ thống nhận dạng tiếng nói dùng những chữ có sẵn trong từ điển, những hiểu biết về ngôn ngữ, những phương pháp phân tích thống kê (statistical analysis) và những thuật toán phức tạp để đưa đến một kết luận chữ đó là chữ gì.

Thí dụ bạn nói “we go there” thì chữ “there” (chỉ nơi chốn) không thể nào là “their” (chỉ sự sở hữu) được.

Tuy có những máy tính hiện đại với khả năng siêu việt, nhưng nhận dạng tiếng nói vẫn không đúng 100% được. Một cách để giảm lỗi là huấn luyện hệ thống nhận dạng tiếng nói. Bộ trợ giúp cá nhân là của riêng một vài người do đó có thể dạy hệ thống nhận dạng tiếng nói biết những đặc điểm của chủ nhân bằng thông tin phản hồi. Tức là nói đi nói lại nhiều lần và hệ thống sẽ tự chỉnh đổi.

Bộ trợ giúp hiện tại

Các công ty phần mềm đều cố đưa ra một bộ trợ giúp để cạnh tranh với thiên hạ. Sau đây là những bộ trợ giúp lớn nhất hiện nay. Microsoft cũng đang phát triển bộ trợ giúp, gọi là Cortana và Samsung thì có Bixby. Nhưng hai phần mềm này chỉ mới ra lò, là loại chạy theo thôi chứ chưa có gì đáng nói tới.

-Google Home: Bộ trợ giúp Google Home có thể chơi nhạc, đọc tin tức, gọi xe Uber và nhiều dịch vụ khác. Google Home cũng có thể giúp bạn kiểm soát một vài máy móc trong nhà, thí dụ như tủ lạnh, truyền hình hay đèn, tuy nhiên chỉ là những máy móc có Google Home hỗ trợ.

Google Home đặc biệt là có thể phân biệt được giọng nói khác nhau của những người ở trong nhà. Để đánh thức Google Home bạn chỉ cần nói: “Okay, Google.” Muốn biết thêm chi tiết bạn có thể vào mạng https://madeby.google.com/home/.

-Amazon Alexa: Alexa là một phần mềm được gài vào loa Echo của Amazon. Bạn có thể đánh thức Alexa bằng tên “Alexa” rồi đưa ra một mệnh lệnh hay một câu hỏi, thí dụ như: “Alexa, what is the forecast for tomorrow?” (Alexa, thời tiết ngày mai ra sao?).

Alexa có thể tìm kiếm hay mua hàng hóa (chỉ dành cho thành viên chính) trên mạng và kiểm soát một vài máy móc trong nhà như Google Home.

-Nên dùng cái nào?: Theo mạng www.pcmag.com thì loa của Google Home tốt hơn là loa của Amazon Alexa. Nhưng người ta mua một trong hai thứ đó là vì nó là bộ trợ giúp chứ không phải vì loa. Amazon Alexa ra đời trước hơn Google Home nên có nhiều hỗ trợ bởi các nhà phát triển phụ hơn. Google Home có khoảng 200 nhà phát triển phụ, trong khi đó Amazon Alexa có tới hơn 11,000. Cho nên tới bây giờ Amazon Alexa vẫn tiện dụng hơn Google Home. Tuy nhiên Google Home đuổi gần kịp Amazon Alexa rồi. Nếu bạn chờ một vài năm nữa có thể Google Home sẽ qua mặt Amazon Alexa.

Bộ trợ giúp trong tương lai

Trong tương lai những máy móc trong nhà đều là loại thông minh (smart) có liên kết mạng qua Wi-Fi hay Bluetooth và đều hỗ trợ Google Home, Amazon Alexa và các phần mềm trợ giúp cá nhân như Apple Siri, Microsoft Cortana và Samsung Bixby. Lúc đó bạn có thể điều khiển mọi vật dụng trong nhà bằng lời nói.

Một điều cần chú ý là những thiết bị này có liên kết mạng nên cũng rất nguy hiểm. Kẻ gian có thể theo đó mà phá hoại. Đã có những trường hợp có người mua tủ lạnh tối tân có nối mạng, nhưng không thay đổi tên đăng nhập và mật khẩu, chỉ giữ nguyên thông tin có sẵn của nhà sản xuất. Do đó bọn tin tặc theo đó mà vào hệ thống mạng lưới trong nhà một cách dễ dàng và ăn cắp những thông tin cá nhân.

Còn chuyện bộ trợ giúp cá nhân mang bia tới cho bạn thì chắc sẽ xảy ra trong tương lai gần. Khi mà các chuyên viên trong công nghệ rô bô và công nghệ bộ trợ giúp cá nhân hợp tác nghiên cứu thì việc này cũng dễ thôi. Trong khi chờ đợi bạn phải chịu khó đi tới tủ lạnh lấy bia một mình, trừ khi bạn có người thật trợ giúp hay một người vợ hiền chiều chồng. Nhưng trường hợp đó cũng nguy hiểm lắm, nhiều khi bạn không có bia uống mà còn bị cằn nhằn.

—————–
Nguồn tài liệu: http://electronics.howstuffworks.com, www.pcmag.com

Điểm tin buổi sáng Thứ Năm, ngày 6 tháng 7 năm 2017

CÓ THỂ BẠN QUAN TÂM

MỚI CẬP NHẬT