Tin nóng ⇢

Meta giới thiệu CM3leon, mô hình AI cho văn bản và hình ảnh

Tập đoàn công nghệ Meta đẩy mạnh hoạt động vào lĩnh vực trí tuệ nhân tạo (AI), giới thiệu mô hình AI mới cho hình ảnh là CM3leon và trước đó là mô hình ngôn ngữ AI mới LLaMA, để theo kịp các công nghệ AI hiện có.

CM3leon là một mô hình chuyển văn bản thành hình ảnh với độ trung thực cao và viết chú thích mạch lạc. Đặc biệt, CM3leon vượt trội trong việc xử lý các đối tượng phức tạp và các ràng buộc trong lời nhắc văn bản so với các mô hình AI khác như DALL-E 2 của OpenAI và Midjourney.

Các tác vụ CM3leon thực hiện

Theo bài blog của Meta, CM3leon có thể thực hiện nhiều tác vụ như sau:

1. Tạo và chỉnh sửa hình ảnh theo hướng dẫn văn bản

  • Chuyển văn bản thành hình ảnh

Đưa ra văn bản gợi ý với cấu trúc có khả năng tổng hợp cao, tạo ra một hình ảnh mạch lạc theo sau yêu cầu. Ví dụ: bốn hình ảnh sau được tạo cho các gợi ý: (1) Một cây xương rồng nhỏ đội mũ rơm và đeo kính râm neon ở sa mạc Sahara. (2) Ảnh chụp cận cảnh bàn tay người, mô hình bàn tay. Chất lượng cao. (3) Nhân vật chính là gấu trúc trong Anime đang chuẩn bị cho một trận chiến hoành tráng với thanh kiếm samurai. Thế trận. Tưởng Tượng, Hình Minh Họa. (4) Biển báo dừng kiểu Fantasy có dòng chữ “1991”.

#image_title
  • Chỉnh sửa hình ảnh theo hướng dẫn văn bản
  • Nhiệm vụ văn bản
  • Chỉnh sửa hình ảnh theo cấu trúc
  • Chuyển đối tượng thành hình ảnh
  • Phân đoạn thành hình ảnh

2. Hình ảnh siêu phân giải

Một mẹo phổ biến để tạo hình ảnh là thêm một giai đoạn siêu phân giải được đào tạo riêng để tạo ra hình ảnh có độ phân giải cao hơn từ các đầu ra của mô hình ban đầu. Điều này cũng hoạt động rất tốt với CM3leon, như chúng tôi trình bày trong các ví dụ bên dưới cho tác vụ tạo văn bản thành hình ảnh.

Bốn hình ảnh ví dụ cho mỗi yêu cầu: (1) Một tách cà phê bốc khói với những ngọn núi ở phía sau. Nghỉ ngơi trong chuyến đi đường. (2) Con đường đẹp, hùng vĩ trong hoàng hôn. Thẩm mỹ. (3) Hòn đảo nhỏ hình tròn giữa hồ nước. Rừng bao quanh hồ. Độ tương phản cao.

Meta đẩy mạnh phát triển công nghệ AI

Meta tận dụng chuyên môn của nhóm khoa học dữ liệu và cơ sở hạ tầng máy tính để nâng cao kiến trúc máy biến áp tự hồi quy của CM3leon. Mô hình này cung cấp nhiều tính năng hình ảnh nâng cao, bao gồm chuyển văn bản thành hình ảnh, chỉnh sửa hình ảnh theo cấu trúc, đối tượng thành hình ảnh, phân đoạn thành hình ảnh và nâng cấp siêu phân giải. Tất cả những điều này giúp tăng cường khả năng sáng tạo và áp dụng AI vào các lĩnh vực như nghệ thuật và thời trang.

Ngoài ra, Meta đưa ra kế hoạch phát hành phiên bản thương mại của mô hình ngôn ngữ LLaMA. Trong tương lai, các nhà phát triển có thể xây dựng các ứng dụng tùy chỉnh được hỗ trợ bởi AI của Meta. Công ty tin rằng việc phát triển các công cụ AI như LLaMA có thể thúc đẩy ngành công nghiệp thời trang và cung cấp những trải nghiệm độc đáo cho người dùng.

Hoạt động kinh doanh hàng đầu của Meta là mạng xã hội, cũng như tập trung nghiên cứu và phát triển về metaverse nên động thái mới nhất cho thấy công ty đang mở rộng khai thác tiềm năng của AI. Mục tiêu của Meta là áp dụng AI vào nhiều lĩnh vực khác nhau và tạo ra những sản phẩm sáng tạo, mang lại lợi ích rõ rệt cho người dùng.

Meta đang đối mặt với nhiều thách thức trong việc phát triển AI, giá trị cổ phiếu sụt giảm và tranh cãi về quyền riêng tư, thông tin sai lệch trên nền tảng Facebook. Dù vậy, Meta không ngừng đặt niềm tin vào tiềm năng của AI và cam kết bảo vệ và phát triển năng lực AI của mình trong thời gian tới.

Có thể bạn quan tâm

Mục lục