Google đã nói quá về 'siêu AI' Gemini?

Đoạn video gây tranh cãi

vừa công bố Gemini, mô hình trí tuệ nhân tạo mạnh mẽ nhất từ trước đến nay của công ty. Tuy nhiên, chỉ sau đúng 1 ngày ra mắt, tân binh của làng AI đã phải hứng chịu nhiều thông tin tiêu cực.

Gemini được kỳ vọng sẽ trở thành một đối thủ xứng tầm của ChatGPT-4. Ảnh: Google

Theo Bloomberg, Google đã phóng đại sức mạnh xử lý của Gemini trong video “Hands-on with Gemini: Interacting with multimodal AI” (tạm dịch là “Thực hành sử dụng với Gemini: Tương tác với AI theo đa phương thức”).

Đoạn video dài 6 phút đã thể hiện khả năng xử lý và phản hồi của Gemini trước hình ảnh, tiếng động và câu hỏi của người dùng. Điều đặc biệt là công cụ AI mới này gần như không có độ trễ khi đưa ra câu trả lời. Mọi thứ đều diễn ra hết sức mượt mà, như thể hai con người đang nói chuyện với nhau.

Nếu chỉ xem lướt qua video, nhiều người sẽ cảm thấy choáng ngợp trước những bước tiến vượt trội của Gemini. Tuy nhiên, họ đã bỏ lỡ một dòng tuyên bố miễn trừ trách nhiệm của Google phía dưới phần mô tả của video.

“Vì mục đích của bản demo này, độ trễ đã được giảm xuống và kết quả đầu ra của Gemini đã được rút gọn”, Google chú thích.

Đây là điều khiến cây bút Parmy Olson đến từ Bloomberg cảm thấy bất bình. Bà cho rằng động thái trên của Google đang đi ngược lại so với những gì mà công ty thể hiện. Trong các hoạt động quảng bá của mình, Google luôn mô tả rằng người dùng có thể nói chuyện trôi chảy với Gemini. Công cụ AI này sẽ quan sát, lắng nghe và phản hồi theo thời gian thực với môi trường xung quanh.

Trong bối cảnh trên, tác giả Olson cho rằng Google đang cố tình “phô trương” nhằm thuyết phục công chúng rằng Gemini không bị tụt hậu so với của OpenAI.

Về phía Google, công ty không đồng tình với các quan điểm trên. Trong một bài đăng mới đây trên mạng xã hội X, ông Oriol Vinyals, Phó chủ tịch phụ trách nghiên cứu cấu trúc học sâu tại DeepMind của Google và cũng là đồng lãnh đạo của Gemini, đã giải thích cách nhóm thực hiện video.

“Tất cả câu lệnh và kết quả đầu ra trong video đều có thật. Chỉ có điều là nó đã được rút ngắn để trở nên gọn gàng hơn. Đoạn video có tác dụng minh họa trải nghiệm người dùng với Gemini. Chúng tôi làm ra nó để truyền cảm hứng cho các nhà phát triển”, ông Oriol Vinyals cho biết.

Ngay lập tức, phía The Verge, một trang tin công nghệ nổi tiếng tại Mỹ, đã đăng đàn phản pháo. Đơn vị này cho rằng nếu Google thực sự muốn truyền cảm hứng cho nhà phát triển thì điều mà công ty cần làm là cho phép các cơ quan báo chí truyền thông và đội ngũ lập trình viên được phép trực tiếp trải nghiệm sản phẩm.

“Hãy để mọi người dùng thử bản beta (thử nghiệm) của Gemini trong một phạm vi nhỏ. Hãy cho chúng tôi thấy nó thực sự mạnh mẽ như thế nào, thay vì trình chiếu các đoạn video hấp dẫn đã được biên tập cẩn thận”, bà Emilia David, phóng viên của The Verge, bình luận.

Những lần “sảy chân” tai hại

Không phải tự nhiên mà Google lựa chọn cách chiếu video demo, thay vì trình diễn trực tiếp khả năng của Gemini trên sân khấu. Trước đó, dù đã được kiểm duyệt kỹ càng, Chatbot Bard của công ty vẫn trả lời sai ngay trong buổi ra mắt ngày 6/2.

Cụ thể, đích thân ông Sundar Pichai, CEO của Google, đã hỏi Bard rằng "những khám phá mới nào từ kính viễn vọng không gian James Webb mà tôi có thể nói với đứa con 9 tuổi của mình?"

Google không hề hay biết lỗi sai của Bard trong buổi ra mắt. Ảnh: Google

Khi trả lời, Bard đưa ra ba gợi ý mà một đứa trẻ 9 tuổi có thể thích, trong đó có câu "JWST đã chụp bức ảnh đầu tiên của một hành tinh ngoài hệ Mặt trời. Những thế giới xa xôi này được gọi là exoplanet".

Theo Telegraph, nhiều nhà khoa học khẳng định câu trả lời trên không chính xác. Bức ảnh đầu tiên về một exoplanet được chụp bởi hệ thống kính viễn vọng Very Large Telescope đặt tại Chile, chứ không phải là James Webb.

Ngay lập tức, câu trả lời tai hại của Bard đã khiến giá cổ phiếu của của Alphabet, công ty mẹ Google, giảm 8%, tương đương khoảng 100 tỷ USD.

Không chỉ có Google, ngay cả Bing AI, chatbot của Microsoft, cũng đã trả lời sai một số câu hỏi ngay trong video trình diễn vào ngày ra mắt.

Theo đó, với câu hỏi liên quan đến du lịch đêm, Bing AI đã đề xuất chuyến đi 5 ngày ở Mexico, cùng danh sách quán bar và nhà hàng sang trọng. Tuy nhiên, ông Dmitri Brereton, chuyên gia về AI, cho biết đa số câu trả lời đều không chính xác. Một số quán được Bing AI gợi ý đã đóng cửa từ lâu. Thậm chí, sản phẩm của nhà Microsoft còn tự “vẽ” ra các thực đơn không có thật của nhà hàng.

Tại Trung Quốc, “ông lớn” cũng đã giới thiệu chatbot của riêng mình với tên gọi Ernie AI. Giống với cách làm của Google, hãng cũng chỉ chiếu video tương tác đã được “cắt gọt” trong buổi lễ ra mắt.

Sau sự kiện này, cổ phiếu niêm yết của Baidu tại Kong đã giảm tới 10% trong cùng ngày. Nhiều người cho rằng bản thân công ty cũng không tự tin vào năng lực xử lý của Ernie AI. Sự thất vọng được đẩy lên cao khi trước đó Baidu đã có những hứa hẹn hấp dẫn về tiềm năng của công cụ AI này.

Thanh Vũ