Categories
Teknologi

Pembesut ChatGPT Rilis Sora, Model AI yang Bisa Buat Video dari Perintah Teks

bachkim24h.com, Jakarta – Pengembang ChatGPT OpenAI telah menciptakan model AI yang dapat mengubah perintah teks menjadi video. Nama AI adalah Sora.

Menurut OpenAI Sora dapat membuat adegan realistis dan imajinatif dari perintah teks. Model text-to-video memungkinkan pengguna membuat video fotorealistik berdurasi hingga satu menit, berdasarkan perintah tertulis.

Menurut Verge, Jumat (16/2/2024), blog OpenAI menyebutkan, “Sora dapat membuat adegan kompleks dengan banyak bentuk, jenis gerakan, serta subjek dan detail tertentu.”

Faktanya, pencipta ChatGPT juga menyadari bahwa metode AI memahami sifat segala sesuatu di dunia fisik, mendeskripsikan pemandangan secara akurat, dan membuat gambar untuk mengekspresikan ide.

Model AI dikatakan mampu membuat video berdasarkan gambar diam. Sora juga dapat mengisi gambar yang hilang di video yang ada atau menyempurnakannya.

Demo yang dibuat oleh Sora disertakan dalam postingan blog OpenAI, bersama dengan tampilan udara California. Video tersebut tampaknya diambil dari dalam kereta di Tokyo.

Namun, masih ada tanda-tanda bahwa video tersebut dibuat oleh AI. Misalnya, lantai bergerak aneh di video museum.

Mengenai hal ini, OpenAI mengatakan bahwa model AI mereka mungkin sulit untuk mencocokkan bentuk fisik yang benar dengan pemandangan yang kompleks. Namun, hasilnya tetap mengesankan.

Harap dicatat bahwa beberapa tahun yang lalu, teks ke gambar seperti Midjourney lebih dari mampu mengubah teks menjadi gambar.

Namun kini kemampuan mengubah teks menjadi video sudah meningkat pesat. Misalnya, perusahaan seperti Runway dan Pika baru-baru ini memperkenalkan fitur teks-ke-video mereka.

Selain itu, Lumiere Google adalah salah satu pesaing utama OpenAI di bidang alat teks ke video.

Seperti Sora, Lumiere menawarkan editor teks dan memungkinkan pengguna membuat video dari gambar diam.

Berbicara tentang Sora, model AI ini kini memiliki sejumlah pengguna yang fokus mengevaluasi risiko dan masalah dalam model tersebut.

OpenAI juga memberikan akses Sora kepada beberapa seniman, desainer, dan pembuat film untuk mendapatkan masukan.

Laporan tersebut menunjukkan bahwa model saat ini tidak dapat secara akurat mensimulasikan objek kompleks. Juga, Sora tidak bisa menjelaskan apa yang sebenarnya terjadi.

Categories
Teknologi

Google Umumkan Gemini 1.5, Makin Pintar dengan Pemahaman Konteks Lebih Luas

bachkim24h.com, Jakarta – Setelah meluncurkan Gemini 1.0 pada Desember lalu, Google merilis Gemini 1.5 dengan lebih banyak perbaikan.

Peningkatan lain yang disebutkan adalah kemampuan memahami konten yang lebih luas.

Jendela konteks model AI berisi simbol-simbol, yaitu blok-blok yang digunakan untuk memproses informasi. Simbol yang diucapkan berupa kata-kata, gambar, video, atau bagian atau bagian kode. Besarnya jendela konteks model, khususnya Google Gemini 1,5″. Ini dapat memberikan lebih banyak informasi,” katanya tentang peningkatan tersebut. Itu dapat diakses dan dioperasikan dengan pengingat khusus.

Mengutip 9to5Google, Sabtu (17/2/2024), jendela konten standar Gemini 1.5 Pro adalah 128.000. Sebaliknya, Gemini 1.0 memiliki 32.000 simbol.

Jumlah token di Gemini 1.5 sama dengan 700,000 kata, 30,000 baris kode, 11 jam audio, atau 1 jam video. Sebagai perbandingan, GPT-4 Turbo memiliki 128.000 power point.

Google Gemini 1.5 dikatakan mampu menganalisis, mengklasifikasikan, dan merangkum sejumlah besar konten secara akurat berdasarkan instruksi yang diberikan.

Misalnya, ketika memasukkan dokumen misi Apollo 11 setebal 402 halaman, model AI mempertimbangkan informasi dari percakapan, peristiwa, dan informasi yang ditemukan dalam dokumen tersebut.

Tak hanya itu, Gemini 1.5 Pro mampu melakukan tugas kognitif dan penalaran yang sangat kompleks dalam berbagai cara, termasuk video.

Misalnya, Buster Keaton berdurasi 44 menit tanpa dialog, model dapat menganalisis berbagai poin dan peristiwa secara akurat. Bagaimanapun, model AI dapat memikirkan detail-detail kecil yang mungkin terlewatkan.

Model Gemini 1.5 Pro AI dapat menangani tugas pemecahan masalah yang rumit dan kode yang panjang.

Ketika diinstruksikan dengan lebih dari 100.000 baris kode, model AI memberikan penalaran yang lebih baik, menyarankan perubahan yang berguna, dan menjelaskan cara kerja berbagai bagian kode.

Sebelumnya, Google mengumumkan akan mengganti namanya menjadi Google Bard. Kini, layanan kecerdasan buatan Google Bard telah resmi beralih ke Gemini.

Informasi perubahan nama tersebut diungkap pekan lalu oleh pengembang Google Gemini melalui akun X. Belakangan ini, setelah pergantian nama, banyak sekali pembaruan pada Google.

Salah satunya, seperti dikutip GSM Arena, Kamis (15/2/2024), kini kehadiran aplikasi tersebut sudah merambah ke kawasan seperti Amerika Latin, Afrika, Asia Pasifik, dan Kanada.

Informasi tersebut diungkap langsung oleh Product Lead Gemini Jack Krawczyk melalui akun X miliknya. Dia menambahkan bahwa Google sedang berupaya untuk segera menghadirkan layanan tersebut ke Eropa.

Meski ketersediaannya masih bertahap, pengguna perangkat Android bisa mem-flash aplikasi Gemini. Menurut banyak laporan, program ini bekerja dengan baik meskipun diunduh secara mandiri.

Perhatikan bahwa aplikasi Gemini menggantikan Google Assistant saat Anda menginstalnya di perangkat Android Anda. Namun, layanan tersebut dikatakan tidak mampu melakukan sejumlah tugas dasar yang dapat dilakukan oleh Asisten Google.

Misalnya, Gemini tidak dapat diminta untuk melakukan hal-hal seperti memulai alarm dan pengingat serta aplikasi yang menyertakan kontrol rumah pintar.

Sekadar informasi, Google resmi mengganti nama portal chat tersebut menjadi Gemini pada Kamis 8 Februari 2024 waktu setempat.

Selain itu, perusahaan juga telah merilis aplikasi Google Gemini khusus untuk perangkat Android dan mengintegrasikan seluruh fitur Duet AI dari Google Workspace ke Gemini.