Nhận diện giọng nói: Cuộc đấu trí giữa các siêu phẩm

| - Chuyên mục: Điện thoại

- Để kiểm tra xem các “trợ lý” giọng nói trên điện thoại di động có thực sự đơn giản hóa cuộc sống của chúng ta hay không, chúng tôi đã dành cho họ những thử thách khác nhau. Và kết quả nhận nhận được cũng khác nhau ...

 

Nói chuyện với một chiếc ti vi, ra ​​lệnh cho thiết bị cảm biến nhiệt độ hay cho máy giặt, đọc cho viết một tinh nhắn gửi tới một máy tính bảng, tất cả các ứng dụng này sẽ trở nên tự nhiên khi bạn nói chuyện (lớn tiếng) với điện thoại trên đường phố. Trong những năm gần đây, điện thoại thông minh vẫn là thiết bị tiêu biểu nhất phản ánh những nâng cấp của tính năng nhận dạng giọng nói. Muốn đánh bàn phím hoặc nhấn ứng dụng trên màn hình, bạn chỉ cần lên tiếng hướng dẫn cho thiết bị di động. Những tiến bộ này, trong đó tiến bộ áp dụng trên xe ô tô được đánh giá cao nhất, giúp bạn gửi một tin nhắn SMS mà không cần dùng tay bấm nút điện thoại, và giúp bạn trong tất cả các tình huống, bạn không cần phải dùng đến thao tác của tay.


 Nhận diện giọng nói: Cuộc đấu trí giữa các siêu phẩm

 

Để đánh giá mức độ nâng cấp của tính năng này, chúng tôi đã thử nghiệm các khả năng của các hệ thống nhận diện giọng nói hiện đang được tích hợp trên điện thoại di động : S-Voice trên Samsung Galaxy S5, Siri trên iPhone 5s, Google Voice trên Nexus 5 chạy hệ điều hành Android và chức năng giọng nói của Windows Phone với Nokia Lumia 1520.

 

Trên mỗi phiên bản điện thoại, tính năng nhận diện giọng nói được kích hoạt dễ dàng : để ngón tay của bạn trên phím vật lí Windows với một chiếc điện chạy Windows Phone, giữ nút dưới cùng của iPhone, kích đúp nút "Home" trên Samsung Galaxy S5 và nói "OK Google" với một chiếc điện thoại di động chạy Android. Sau khi cài đặt hoặc đọc lệnh truy nhập, một số điện thoại trong số đó có thể cho bạn câu trả lời hoặc khởi động cuộc hội thoại, yêu cầu xác định thông tin hoặc khẳng nhận chọn lựa.

 

Tùy thuộc vào phiên bản, có thể chọn một giọng đàn ông hay phụ nữ, với kết quả luôn luôn không được tốt lắm, đặc biệt là trên Galaxy S5 có giọng đơn điệu làm bạn khá khó chịu. Trên tất cả các thiết bị, bạn cần kết nối Internet để truyền câu mệnh lệnh đến một hệ thống máy tính lớn, nơi đó lệnh được phân tích và sẽ có phản hồi tương thích. Nếu không có mạng di động hoặc không kết nối Wi-Fi, bạn đừng không mong đợi chiếc điện thoại thông minh của mình có thể kích hoạt tính năng và ra lệnh bằng giọng nói.

 

Về mặt lý thuyết, hệ thống nhận diện giọng nói có thể hiểu một câu hỏi đơn giản hoặc một câu trong ngôn ngữ của loài người chúng ta. Máy sẽ đáp ứng con người, các kỹ sư khẳng định. Nhưng trên thực tế, điều này đôi khi lại ngược lại. Chúng ta phải học cách yêu cầu thế nào cho đúng (theo thức nguyên thể hay mệnh lệnh thức) và biết những chuỗi từ chuẩn để khi ra lệnh, điện thoại di động sẽ làm theo đúng ý.

 

Để kích hoạt ứng dụng, ví dụ, ở thiết bị này, chúng ta nói "chạy" theo sau là tên của ứng dụng, ở thiết bị khác chỉ cần nói "bắt đầu", ở thiết bị thứ 3 lại chỉ cần nói "mở" mà thôi. Thiết bị của Google mất định hướng khi được yêu cầu "Hãy đánh thức tôi dậy vào 7h ngày mai" hoặc "Đặt chuông báo thức lúc 7h ngày mai". Thiết bị này chỉ chấp nhận công thức : "Đánh thức tôi dậy vào 7 giờ sáng mai". Từ ngữ và cách biểu đạt tạo sự bất đồng (không hiểu nhau) giữa ý của người sử dụng và cách mà thiết bị thực hiện.

 

Tuy nhiên, trong nhiều trường hợp, chức năng giọng nói thực hiện tốt nhiệm vụ của mình.

 

Gọi điện : iPhone 5 và Nexus 5 giống nhau

 

Bốn loại điện thoại thông minh kể trên có thể nhận các lệnh theo kiểu như "Gọi 06 xx xx xx" hoặc "Gọi Marc Dupont," miễn là tên người bạn cần liên lạc được lưu vào danh bạ. Nếu người ta yêu cầu gọi "mẹ" mà không giải thích gì thêm, tất cả các thiết bị đều chọn một số liên lạc... Nhưng với iPhone thì khác, thiết bị này phản hồi : "Mẹ của bạn tên là gì ?" .

Và nếu bạn yêu cầu smartphone gọi "Pizza Domino", mà tên này không xuất hiện trong danh bạ, iPhone sẽ cung cấp cho bạn số điện thoại của các nhà hàng có biển Pizza ở gần bạn. Đối với Nexus 5, chiếc điện thoại thông minh này sẽ tự động chọn một cửa hàng gần với bạn nhất. Đối với Galaxy, nó sẽ hiển thị một trang chứa địa chỉ Pizza trên Internet. Với smartphone hiệu Nokia, thiết bị sẽ trả lời nói : "không tìm thấy địa chỉ".

 

Thao tác đọc cho viết : Nexus 5 cấp tiến

 

Chiếc điện thoại thông minh của chúng ta biết làm thế nào soạn một tin nhắn SMS có sửa lỗi chính tả và gửi đi. Thậm chí Samsung Galaxy, Nexus và iPhone còn nhận biết được những công thức như "Cảnh báo Marc rằng tôi sẽ bị trễ" hay "Gửi một tin nhắn SMS đến Marc : tôi sẽ bị muộn".

 

Về phần mình, Nokia tiến hành hai thao tác, đầu tiên phản ứng với lệnh "Gửi tin nhắn SMS", rồi sau đó chờ đợi để người sử dụng đọc để soạn văn bản. Lệnh này khó hơn đối với e-mail. iPhone và Nexus diễn giải chính xác hướng dẫn như "Gửi email đến Marc Dupont, chủ đề : họp vào ngày mai, tin nhắn : theo dự kiến, cuộc họp sẽ được tổ chức vào ngày mai tại tòa nhà B". Smartphone hiệu Nokia yêu cầu cài đặt trước tiên ứng dụng e-mail, sau đó nhấn vào ứng dụng trên các biểu tượng màn hình và cuối cùng là viết chính tả bằng giọng nói. S-Voice, "không cung cấp tính năng này" ...

 

Ra lệnh : iPhone vượt trội

 

Tùy từng trường hợp, điện thoại di động có thể thực hiện các lệnh liên quan đến hoạt động của nó. Tất cả các thiết bị đồng ý bật máy ảnh và chạy một ứng dụng (bằng cách chọn công thức đúng), nhưng chỉ có Galaxy và iPhone biết kích hoạt chế độ máy bay hoặc kết nối Bluetooth khi được yêu cầu. Ngoại trừ Nokia, các phiên bản thử nghiệm cũng đồng ý với lệnh khởi động ứng dụng nghe nhạc khi bạn phát âm tên của một bài hát hoặc của một nghệ sĩ.

 

iPhone cũng chấp nhận lệnh (không chút do dự) xem một bộ phim, trong khi Galaxy không hiểu tiêu đề bằng tiếng Anh như Gravity (trọng lực) hay Wall-E, và Nexus cố tìm kiếm xem phim trong thư viện phim trực tuyến. Cuối cùng, việc tìm kiếm một tuyến đường không được thực hiện như mong đợi. Chỉ có iPhone làm tốt điều này, smarphone của Apple chỉ ra đường : đi đến một công ty hoặc một địa chỉ cụ thể.

 

Vạch kế hoạch : iPhone chu đáo hơn

 

Nếu tất cả các thiết bị, ngoại trừ Nokia, biết đặt chuông nhắc nhở cho một giờ và một ngày cụ thể, thì chỉ có Galaxy S5 và iPhone 5s dễ dàng lưu một cuộc hẹn sau hướng dẫn "Ăn tối với Marc Dupont ở Paris, 19h thứ bảy" và gửi thư mời đến số liên lạc tương ứng. Họ cũng có thể trả lời theo cách phù hợp những câu hỏi như "Cuộc hẹn tiếp theo của tôi là gì?" Và "Cuộc họp tiếp theo của tôi vào lúc mấy giờ ?".

 

Điện thoại thông minh của chúng ta cũng có thể ghi lại những lưu ý bằng ​​giọng nói khi người ta sử dụng ngữ "Lưu ý" hoặc "Lưu ý rằng". Về bản chất, thiết bị Nokia vẫn giữ ghi âm giọng nói. Nhưng chỉ có iPhone có thể tạo ra một cảnh báo sẽ được kích hoạt tùy thuộc vào vị trí sau lệnh "Nhắc tôi mua bánh mì trên đường về nhà".

 

Hỏi : iPhone vẫn ưu thế hơn

 

Đặt một câu hỏi, nhận được câu trả lời : đó là một trong những lời hứa ấn tượng nhất của chức năng nhận diện giọng nói. Galaxy và iPhone nổi trội khi trả lời chính xác khi được hỏi giờ (đóng hoặc mở cửa) của bảo tàng Grevin hay Jean d'Ormesson bao nhiêu tuổi. Nhưng chỉ có iPhone có thể giới thiệu một cơ sở ở gần nhất sau khi nhận lệnh phải tìm một nhà hàng Trung Quốc quanh đấy.

 

Cuối cùng, ngoại trừ Nokia, tất cả các smartphone có thể trả lời chính xác khi được hỏi về thời tiết, cho những ngày sắp tới hay cho một nơi cụ thể. Nhưng chỉ có Nexus và iPhone cho ta biết kết quả thể thao mà không cần phải tra mạng. Đôi khi ta gặp tình huống thật hài hước : khi được hỏi về tỉ số cuối cùng của PSG, Siri trả lời: "PSG thật bướng bỉnh ở Montpelliervới tỉ số 4-0 ...".


Quế Anh - (tổng hợp)