Meta gần đây đã ra mắt LLaMa 2, một mô hình ngôn ngữ tự nhiên thương mại mã nguồn mở và miễn phí có thể so sánh với GhatGPT 3.5. Ngoài việc thông báo rằng LLaMa 2 sẽ là nguồn mở và miễn phí cho mục đích thương mại, các quan chức của Meta cũng công bố một số dữ liệu liên quan về LLaMa 2. Về phiên bản tham số, LLaMa 2 cung cấp ba phiên bản khác nhau là 7 tỷ tham số, 13 tỷ tham số và 70 tỷ tham số.
Khi các mô hình ngôn ngữ quy mô lớn như LLaMa 2 ngày càng phá vỡ nhiều lĩnh vực sản xuất, cách các doanh nghiệp áp dụng các mô hình lớn và cách tư nhân hóa việc triển khai AI đã trở thành một chủ đề nóng. Gần đây, các doanh nghiệp nhà nước trung ương và các khách hàng công nghiệp có tiềm lực tài chính tương đối mạnh đang tìm kiếm các giải pháp mô hình quy mô lớn tư nhân hóa để giúp các khách hàng công nghiệp xây dựng các mô hình quy mô lớn chuyên dụng dựa trên dữ liệu đặc thù của ngành và không gian thị trường.
Hiện tại, nhiều công ty có thể bố trí triển khai tư nhân hóa các mô hình AI lớn, chẳng hạn như Contextual AI đang tiến hành nghiên cứu kỹ thuật về thế hệ nâng cao (RAG) để triển khai tư nhân hóa doanh nghiệp, Cohere cũng đang đào tạo các mô hình theo yêu cầu của khách hàng, ví dụ như Reka’s Công nghệ sàng lọc mô hình là Khách hàng cung cấp nền tảng khả năng mã được tư nhân hóa hàng đầu trong ngành, giúp cải thiện đáng kể hiệu quả R&D của doanh nghiệp. R 3 PO có mặt ở đây để phân tích lộ trình này lần này và chia sẻ với bạn tình hình hiện tại cũng như tiềm năng phát triển của việc triển khai tư nhân hóa các mô hình lớn AI.
1. Tương lai số của doanh nghiệp không thể tách rời việc tư nhân hóa và triển khai các mô hình AI quy mô lớn
Nhiều doanh nghiệp truyền thống lớn không thể sử dụng dịch vụ AI đám mây công cộng do bảo mật dữ liệu và các cân nhắc khác. Tuy nhiên, năng lực cơ bản của AI tại các doanh nghiệp này còn tương đối yếu, thiếu sự tích lũy về công nghệ và nhân tài, tuy nhiên, nâng cấp thông minh là một nhu cầu cứng nhắc, thậm chí cấp bách của các doanh nghiệp. triển khai tư nhân hóa các trạm trung gian AI trong doanh nghiệp là một chiến lược kinh tế và hiệu quả hơn.
Tencent Tang Daosheng đã chỉ ra trong một bài phát biểu gần đây: “Mô hình lớn nói chung có thể giải quyết 70% -80% vấn đề trong 100 kịch bản, nhưng nó có thể không đáp ứng đầy đủ nhu cầu của một kịch bản cụ thể của doanh nghiệp.” mô hình lớn nói chung thường dựa trên nhiều tài liệu công cộng và đào tạo thông tin mạng thiếu sự tích lũy của nhiều kiến thức chuyên môn và dữ liệu ngành, do đó có những thiếu sót về tính phù hợp và chính xác của ngành. Tuy nhiên, người dùng có yêu cầu cao đối với dịch vụ chuyên nghiệp do doanh nghiệp cung cấp và khả năng chịu lỗi thấp, một khi doanh nghiệp cung cấp thông tin sai lệch cho công chúng có thể gây ra hậu quả nghiêm trọng. Bằng cách tinh chỉnh dựa trên mô hình ngành lớn và kết hợp dữ liệu của riêng mình, doanh nghiệp có thể xây dựng các dịch vụ thông minh có tính sẵn sàng cao. Ngoài ra, so với các mô hình lớn có mục đích chung, các mô hình chuyên dụng có ít tham số hơn, chi phí đào tạo và suy luận thấp hơn cũng như tối ưu hóa mô hình dễ dàng hơn.
Đồng thời, các mô hình công nghiệp quy mô lớn và các công cụ phát triển mô hình có thể ngăn chặn sự rò rỉ dữ liệu nhạy cảm của công ty thông qua việc triển khai tư nhân hóa, kiểm soát quyền lực và mã hóa dữ liệu. Ngoài ra, việc ứng dụng các mô hình lớn vào các kịch bản thực tế đòi hỏi một loạt các liên kết như xây dựng thuật toán, triển khai mô hình và không được có sai sót trong mỗi liên kết. Các mô hình cần phải được lặp lại và điều chỉnh liên tục, điều này đòi hỏi phải sử dụng các công cụ kỹ thuật và hệ thống.
2. Ý nghĩa của việc tư nhân hóa các mô hình lớn AI là gì?
Gần đây, Reka, công ty cung cấp dịch vụ xử lý tùy chỉnh quy mô lớn cho các doanh nghiệp, cũng nhận được khoản tài trợ 58 triệu USD, phản ánh sự mở rộng dần dần thị trường cho các mô hình AI do doanh nghiệp tư nhân hóa.
Mặc dù các mô hình ngôn ngữ quy mô lớn như GPT-4 đã có khả năng phân tích văn bản và tạo văn bản rất cao nhưng chúng rất tốn kém để đào tạo và khó đào tạo trong các miền dọc và hiện rất khó hoàn thành các nhiệm vụ cụ thể như viết bản sao quảng cáo theo phong cách thương hiệu. Về vấn đề này, “bản chất phổ quát” của họ trở thành một trách nhiệm pháp lý.
Hướng đến khó khăn trong việc kết hợp ứng dụng và AI trong lĩnh vực ngành dọc của doanh nghiệp, giải pháp triển khai cổ phần hóa doanh nghiệp đã trở thành giải pháp được ưu tiên lựa chọn. Triển khai tư nhân hóa AI doanh nghiệp là quá trình di chuyển công nghệ AI từ nền tảng đám mây công cộng sang cơ sở hạ tầng riêng của doanh nghiệp. Phương pháp triển khai này cho phép doanh nghiệp có được mức độ bảo mật dữ liệu và bảo vệ quyền riêng tư cao hơn, đồng thời kiểm soát và tùy chỉnh các ứng dụng AI tốt hơn. Việc triển khai tư nhân hóa AI dành cho doanh nghiệp thường liên quan đến việc xây dựng cơ sở hạ tầng AI nội bộ, khả năng lưu trữ và xử lý dữ liệu, đồng thời nhờ các chuyên gia AI quản lý và vận hành toàn bộ hệ thống.
Khi đề cập đến tầm quan trọng cần thiết của việc triển khai tư nhân hóa AI doanh nghiệp, Reka chủ yếu giải thích chi tiết về ngành từ năm khía cạnh sau:
l Tăng cường quyền riêng tư và bảo mật dữ liệu
Bằng cách triển khai hệ thống AI trong doanh nghiệp, dữ liệu nhạy cảm không phải rời khỏi phạm vi bảo mật của doanh nghiệp, giảm nguy cơ rò rỉ dữ liệu và vi phạm bảo mật. Điều này giúp doanh nghiệp tăng cường sự tự tin và bảo vệ cho các nhiệm vụ liên quan đến thông tin nhạy cảm.
l Cải thiện khả năng tùy biến và tính linh hoạt
Việc triển khai tư nhân hóa AI doanh nghiệp cho phép các tổ chức điều chỉnh ứng dụng AI theo nhu cầu của họ. Khả năng tùy chỉnh này cho phép doanh nghiệp thích ứng tốt hơn với các tình huống kinh doanh cụ thể và linh hoạt điều chỉnh, mở rộng khi cần thiết.
l Hiệu suất cao và độ trễ thấp
Triển khai hệ thống AI trên cơ sở hạ tầng nội bộ của doanh nghiệp có thể đạt được tốc độ truyền và xử lý dữ liệu nhanh hơn. Điều này rất quan trọng đối với các doanh nghiệp yêu cầu ra quyết định theo thời gian thực và phản ứng nhanh, nâng cao hiệu quả và khả năng cạnh tranh tổng thể.
l Tăng hiệu quả chi phí
Mặc dù việc triển khai AI của doanh nghiệp tư nhân hóa đòi hỏi một số khoản đầu tư ban đầu nhưng nó có thể có tác động tích cực về mặt chi phí về lâu dài. So với sự phụ thuộc lâu dài vào nền tảng đám mây công cộng, việc triển khai tư nhân hóa doanh nghiệp có thể giảm chi phí vận hành và kiểm soát cũng như lập kế hoạch ngân sách tốt hơn.
l Quản trị và tuân thủ dữ liệu
Việc triển khai AI dành cho doanh nghiệp được tư nhân hóa cho phép doanh nghiệp quản lý và kiểm soát quản trị dữ liệu tốt hơn để đáp ứng các yêu cầu về quy định và tuân thủ. Điều này đặc biệt quan trọng đối với các ngành liên quan đến bảo vệ quyền riêng tư cá nhân và tuân thủ việc sử dụng dữ liệu.
Các nhà nghiên cứu từ DeepMind, Google, Baidu và Meta đã thành lập Reka, hiện do DST Global Partners và Radical Ventures lãnh đạo, với sự tham gia của đối tác chiến lược Snowflake Ventures và các nhà đầu tư bao gồm cả cựu Giám đốc điều hành GitHub Nat Friedman.
Reka hiện đã phát triển sản phẩm thương mại đầu tiên của mình là Yasa. Tuy chưa hoàn toàn đạt được mục tiêu ban đầu nhưng Yasa đã có bước đột phá nhỏ trong việc tùy chỉnh mẫu xe. Yogatama cho biết Yasa là trợ lý AI đa phương thức đã được đào tạo để hiểu hình ảnh, video và dữ liệu dạng bảng ngoài các từ và cụm từ; ngoài ra, nó có thể tự động tạo ra ý tưởng và trả lời các câu hỏi cơ bản, đồng thời cũng có thể đưa ra một số góc nhìn về hoạt động của công ty theo dữ liệu nội bộ.
Không giống như các mẫu như GPT-4, Yasa có thể dễ dàng được cá nhân hóa cho dữ liệu và ứng dụng độc quyền. Ngoài văn bản, Yasa còn là một “trợ lý” AI đa phương thức được đào tạo để hiểu hình ảnh, video và dữ liệu dạng bảng bên cạnh các từ và cụm từ. Yogatama cho biết, nó có thể được sử dụng để tạo ra ý tưởng và trả lời các câu hỏi cơ bản cũng như hiểu rõ hơn về dữ liệu nội bộ của công ty.
Bước tiếp theo của Reka là chuyển sự chú ý sang AI có thể chấp nhận và tạo ra nhiều loại dữ liệu hơn cũng như tự cải thiện, luôn cập nhật dữ liệu mà không cần đào tạo lại. Để đạt được mục tiêu này, Reka cũng cung cấp dịch vụ cho phép phát triển các mô hình có thể điều chỉnh phù hợp với tập dữ liệu tùy chỉnh hoặc độc quyền của công ty. Khách hàng có thể chạy các mô hình được xử lý tùy chỉnh trên cơ sở hạ tầng của riêng họ hoặc thông qua API của Reka Tùy thuộc vào các ràng buộc của ứng dụng và dự án.