Video YouTube của bạn đang bị Google và OpenAI "tận dụng" để huấn luyện mô hình AI

SkylerNew · 10/4/24

Nhằm mục đích truy cập lượng lớn nội dung tiếng Anh chất lượng từ internet năm 2021, các nhà nghiên cứu của OpenAI đã tạo ra công cụ nhận diện giọng nói có tên Whisper, theo tờ The New York Times. Whisper được thiết kế để chuyển đổi âm thanh từ video YouTube, cung cấp cho công ty nguồn dữ liệu quý giá nhằm đào tạo các mô hình ngôn ngữ (LLM) của họ.

OpenAI được cho là biết rằng việc “cạo” dữ liệu từ YouTube vi phạm các quy định về bản quyền, nhưng vẫn tiến hành, cho rằng hành động này có thể được coi là “sử dụng công bằng” (fair use). Tờ Times viết rằng chủ tịch OpenAI, Greg Brockman, đã đích thân thu thập các video được chuyển đổi thành văn bản sau đó.

Ta có thể nghĩ rằng OpenAI hành động như vậy sẽ khiến Google không mấy hài lòng, nhưng điều đó thật đạo đức giả khi chính Google cũng chuyển đổi video trên YouTube đào tạo mô hình AI, tiềm ẩn khả năng vi phạm bản quyền từ những nhà sáng tạo nội dung.

Trong một cuộc phỏng vấn với Bloomberg tuần trước, CEO YouTube Neal Mohan nói rằng các điều khoản dịch vụ của nền tảng không cho phép chuyển đổi thành văn bản hoặc tải xuống nội dung video trái phép. Khi được hỏi về vấn đề OpenAI, ông cho biết: “Tôi đã đọc các bài báo nói nó có thể đã được dùng hoặc không. Bản thân tôi không có thông tin về việc này.”

Matt Bryant, phát ngôn viên Google, nhắc lại các quy định trong điều khoản dịch vụ, bổ sung rằng công ty đã “sử dụng nhiều biện pháp kỹ thuật và pháp lý” để phòng chống hành vi trái phép. Google nói các mô hình AI của họ được đào tạo bằng “1 số nội dung YouTube” được cấp phép sử dụng theo thoả thuận với nhà sáng tạo nội dung.

Tờ NY Times cho biết Google đã mở rộng điều khoản dịch vụ của mình nhằm giành nhiều quyền khai thác các nội dung khách hàng, như tài liệu Google Docs công khai và những đánh giá về nhà hàng trên Google Maps, nhằm phục vụ các mô hình AI của công ty.

Video YouTube của bạn đang bị Google và OpenAI tận dụng để huấn luyện mô hình AI

Chính sách sửa đổi đã được công bố vào ngày 1 tháng 7, hy vọng rằng kỳ nghỉ lễ Độc Lập sẽ gây xao nhãng dư luận.

Meta cũng được cho là đang tính tới sử dụng các biện pháp mờ ám để thu được nhiều dữ liệu hơn phục vụ việc đào tạo LLM. Tờ NY Times viết rằng công ty mẹ của Facebook thậm chí cân nhắc thu thập dữ liệu vi phạm bản quyền trên Internet, kể cả có thể đối mặt với những vụ kiện. Bởi quá trình thương lượng với bên nắm giữ bản quyền sẽ tốn quá nhiều thời gian.

Hàng ngàn tổ chức và cá nhân đang phản đối, thậm chí đưa ra các vụ kiện chống lại các công ty AI lớn liên quan đến việc sử dụng nội dung sáng tạo của họ mà không trả phí hoặc ghi nhận nguồn gốc. Tờ The New York Times đang kiện OpenAI và Microsoft vì đã sử dụng các bài báo bản quyền của họ. Tháng 2 vừa rồi, OpenAI cáo buộc chính tờ báo này trả tiền cho người “hack” chatbot nổi tiếng của công ty và các sản phẩm khác để tạo ra bằng chứng gây hiểu lầm, ủng hộ cho các cáo buộc trên.

Theo VN review

Video YouTube của bạn đang bị Google và OpenAI "tận dụng" để huấn luyện mô hình AI

SkylerNew

Chuyên viên tin tức

So sánh TV Sony X90L và Samsung Q80C - Năm nay TV Full Array LED nào vượt trội?

Bài mới nhất