Tập đoàn internet hàng đầu Trung Quốc, Tencent, đã công bố mô hình trí tuệ nhân tạo (AI) mới mang tên Follow-Your-Click vào ngày 15/3. Công cụ hoạt hình độc đáo này, hiện đã có mặt trên trang GitHub mã nguồn mở của Microsoft, cho phép người dùng tạo ra các video hoạt hình ngắn chỉ bằng cách nhấp chuột vào các phần cụ thể của hình ảnh và biến chúng thành video động.

Công cụ Follow-Your-Click của Tencent

Dự án Follow-Your-Click là thành quả của sự hợp tác giữa nhóm Hunyuan thuộc Tencent, Đại học Khoa học và Công nghệ Hong Kong, và Đại học Thanh Hoa của Trung Quốc. Tencent dự định sẽ công bố mã nguồn đầy đủ của công cụ này vào tháng 4, nhưng người dùng đã có thể trải nghiệm phiên bản dùng thử trên GitHub.

Điểm đặc biệt của Follow-Your-Click là khả năng giải quyết vấn đề mà nhiều mô hình chuyển hình ảnh thành video khác trên thị trường gặp phải: thay vì di chuyển toàn bộ cảnh, công cụ này tập trung vào việc di chuyển các đối tượng cụ thể trong ảnh. Điều này khác biệt so với các mô hình AI khác, thường yêu cầu người dùng cung cấp mô tả chi tiết về cách thức và vị trí di chuyển của hình ảnh.

Nhóm nghiên cứu của Tencent đã chia sẻ trên arXiv rằng: “Khung làm việc của chúng tôi mang lại khả năng kiểm soát đơn giản nhưng chính xác hơn và hiệu suất tạo video tốt hơn so với các phương pháp trước đây”.

Tạo video từ văn bản đã trở thành xu hướng nổi bật kể từ khi OpenAI giới thiệu Sora vào ngày 15/2. Trước đó, vào tháng 1, Tencent cũng đã giới thiệu VideoCrafter2, một công cụ chỉnh sửa và tạo video nguồn mở có khả năng tạo video từ văn bản. Đây là phiên bản nâng cấp của VideoCrafter1, ra mắt vào tháng 10/2023, nhưng chỉ hỗ trợ tạo video dài 2 giây.

Các đối thủ của Tencent tại Trung Quốc cũng không kém cạnh. Alibaba gần đây đã ra mắt công cụ tạo video chân dung EMO, biến hình ảnh và lời nhắc âm thanh thành video hát và nói chuyện. Cùng thời gian, ByteDance cũng đã phát hành MagicVideo-V2, một mô hình chuyển văn bản thành video, mở rộng cuộc đua công nghệ AI trong lĩnh vực tạo video.

Xem thêm:

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *