Apa yang Terjadi?
Nah, lo tahu bahwa AI saat ini sangat bergantung pada text data untuk dilatih. Tapi, masalahnya adalah text data yang berkualitas tinggi sudah mulai habis. Penelitian terbaru dari Meta FAIR dan New York University menemukan bahwa unlabeled video dapat menjadi sumber data terbesar berikutnya untuk AI.
Detail Teknis
Terus, penelitian ini menggunakan metode yang disebut flow matching untuk melatih model AI pada video dan image-text pairs. Hasilnya, model AI dapat belajar dari video dan image-text pairs tanpa mengganggu kemampuan bahasa. Bahkan, model AI dapat menghasilkan gambar yang lebih baik ketika dilatih dengan text dan video secara bersamaan.



