Meta, công ty mẹ của Facebook, công bố LLaMA với 65 tỷ tham số, kém ChatGPT nhưng được huấn luyện trên 1.400 tỷ từ, gấp năm lần mô hình OpenAI. Meta cho biết mô hình mới của họ có thể giúp các nhà nghiên cứu cải thiện và sửa chữa các công cụ AI thúc đẩy “thông tin sai lệch”.
Meta đã đào tạo và sẽ phát hành một mô hình ngôn ngữ lớn mới cho các nhà nghiên cứu, Giám đốc điều hành Mark Zuckerberg thông báo vào thứ Sáu (24.02) trên Facebook cá nhân của mình.
Ngày 24/2, Meta cho biết đã phát hành mô hình ngôn ngữ mới được gọi là LLaMA, nhằm giúp các nhà khoa học và kỹ sư khám phá các ứng dụng cho AI như trả lời câu hỏi và tóm tắt tài liệu. Mô hình này làm nóng cuộc đua siêu AI khi các công ty công nghệ lớn đều đang không thể đứng ngoài xu hướng trí tuệ nhân tạo.
LLaMA được viết tắt từ Large Language Model Meta AI (Mô hình Ngôn ngữ Lớn về AI của Meta), được phát triển bởi nhóm Nghiên cứu AI cơ bản (FAIR). Nó hoạt động dưới dạng mở, cho phép các nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí.
Trước mắt, LLaMA sẽ tập trung cho 20 ngôn ngữ dùng bảng chữ cái Latinh và Cyrillic. Tiếng Việt chưa nằm trong danh sách này. Theo công bố, mô hình AI của Meta đòi hỏi sức mạnh tính toán “ít hơn nhiều” so với các siêu AI trước đó như ChatGPT của OpenAI, Bing AI của Microsoft và Bard của Google (chưa được phát hành).
Nó có tối đa 65 tỷ tham số, bằng 1/3 so với ChatGPT, nhưng lại được huấn luyện trên 1.400 tỷ từ, cao gấp x5 lần siêu AI ChatGPT của OpenAI (Chat-GPT 3 của OpenAI có 175 tỷ tham số.).
LLM đã cho thấy rất nhiều hứa hẹn trong việc tạo văn bản, trò chuyện, tóm tắt tài liệu bằng văn bản và các nhiệm vụ phức tạp hơn như giải các định lý toán học hoặc dự đoán cấu trúc protein.
Trong bài đăng của mình, Zuckerberg cũng cho biết công nghệ LLM cuối cùng có thể giải các bài toán hoặc tiến hành nghiên cứu khoa học. “Meta cam kết với mô hình nghiên cứu mở này và chúng tôi sẽ cung cấp mô hình mới của mình cho cộng đồng nghiên cứu AI,” Zuckerberg viết.
Mặt trận siêu AI khởi động từ cuối năm ngoái khi OpenAI phát hành ChatGPT. Sau đó, Microsoft tuyên bố tích hợp mô hình này vào công cụ tìm kiếm Bing. Google đáp lại bằng chatbot Bard AI nhưng mới đang thử nghiệm nội bộ. Một số công ty công nghệ lớn ở châu Á như Baidu cũng xây dựng sản phẩm tương tự có tên Ernie để cạnh tranh.
Meta tuyên bố LLaMA có thể vượt trội các đối thủ trong một số tình huống cụ thể. Với 65 tỷ tham số, nó cho thấy sức mạnh không thua kém Chinchilla70B và PaLM-540B của Google. Tháng 5/2022, Meta cũng đã phát hành mô hình ngôn ngữ lớn OPT-175B, tạo cơ sở cho phiên bản chatbot BlenderBot 3. Sau đó, công ty giới thiệu mô hình Galactica có thể viết bài báo khoa học và giải các bài toán. Tuy nhiên, cả hai AI này đều nhanh chóng bị gỡ bỏ do liên quan đến vấn đề bản quyền và thông tin sai lệch.