OpenAI vừa giới thiệu bản cập nhật quan trọng nhất của ChatGPT, cho phép người dùng tương tác với trí tuệ nhân tạo (AI) thông qua giọng nói và xử lý hình ảnh. ChatGPT có khả năng trò chuyện bằng giọng nói và đọc nội dung văn bản, và được đánh giá có trò chuyện tự nhiên hơn các trợ lý ảo phổ biến khác. Tính năng xử lý hình ảnh cũng cho phép người dùng giải quyết các vấn đề dựa trên ảnh chụp. Bản cập nhật này dự kiến sẽ được phát hành vào hai tuần tới.
ChatGPT giới thiệu tính năng trò chuyện và xử lý hình ảnh

OpenAI vừa công bố bản cập nhật mới nhất cho ChatGPT, cho phép người dùng tương tác với trí tuệ nhân tạo (AI) bằng giọng nói và xử lý hình ảnh. Đây được xem là một bước tiến quan trọng, mở ra nhiều ứng dụng đa dạng cho công nghệ AI.
Tính năng trò chuyện bằng giọng nói
ChatGPT hiện đã có khả năng tham gia vào cuộc trò chuyện bằng giọng nói, kể chuyện hoặc đọc một đoạn văn bản. Theo đánh giá từ Washington Post, ChatGPT có khả năng tương tác trò chuyện rõ ràng hơn so với các trợ lý ảo phổ biến khác như Google Assistant, Alexa hay Siri.
Đối với OpenAI, một trong những thách thức lớn là làm cho công nghệ của họ trở nên dễ tiếp cận hơn cho hàng trăm triệu người dùng tiếp theo. Peter Deng, Phó Chủ tịch phụ trách Sản phẩm Tiêu dùng của OpenAI đã thảo luận về vấn đề này và nhấn mạnh rằng công nghệ mới giúp thu hút sự chú ý và tăng khả năng tiếp cận của AI.
Tính năng xử lý hình ảnh
Bản cập nhật mới cũng mang đến tính năng xử lý hình ảnh cho ChatGPT. Người dùng có thể chụp ảnh mọi thứ xung quanh và yêu cầu ChatGPT phân tích hình ảnh để giải quyết các vấn đề. Ví dụ, người dùng có thể dùng công nghệ này để khắc phục sự cố trong lò nướng, kiểm tra thực phẩm trong tủ lạnh hoặc phân tích biểu đồ liên quan đến công việc.
Tính năng xử lý hình ảnh của ChatGPT tương tự với Google Lens của Alphabet, cho phép người dùng truy cập thông tin bằng cách chụp và phân tích hình ảnh.
Công nghệ đa phương thức trong tương lai

Việc ChatGPT giới thiệu tính năng trò chuyện và xử lý hình ảnh đánh dấu bước tiến quan trọng trên con đường trở thành một trợ lý ảo đa phương thức. Cùng với khả năng “nhìn” và “nghe” thế giới, ChatGPT sẽ có khả năng phản hồi bằng giọng nói và hình ảnh, không chỉ bằng văn bản như trước đây.
Các nhà nghiên cứu trong lĩnh vực Trí tuệ Nhân tạo đánh giá rằng công nghệ đa phương thức đang là xu hướng phát triển tiếp theo. Công nghệ này có thể được áp dụng rộng rãi trong nhiều lĩnh vực cuộc sống, từ điện thoại di động, TV, ô tô đến loa thông minh.
Amazon đầu tư vào công ty AI
Trong tin tức liên quan, Amazon đã thông báo về việc đầu tư 4 tỷ USD vào công ty khởi nghiệp AI có tên Anthropic. Đây được xem là thỏa thuận lớn nhất trong lĩnh vực Trí tuệ Nhân tạo kể từ khi Microsoft đầu tư hơn 10 tỷ USD vào OpenAI.
Amazon cũng đã mở rộng tính năng “trò chuyện” của loa thông minh Alexa thông qua chatbot, tuy nhiên, tính năng này còn đang trong giai đoạn hạn chế.
Với những bước tiến mới trong công nghệ AI, cùng với sự quan tâm và đầu tư của các công ty lớn như Amazon, dự kiến trong tương lai, trợ lý ảo sẽ trở nên thông minh hơn và có thể tương tác với con người một cách tự nhiên.
ChatGPT cam kết tiếp tục phát triển và cải thiện khả năng của mình, trở thành một đối thủ đáng gờm trong lĩnh vực trợ lý ảo truyền thống.