INFOTANGERANG.ID– Google kembali memperkenalkan Artificial Intelligence/AI terbarunya bernama Gemini 2.0 Flash pada Rabu, 11 Desember 2024.
Model bahasa kecerdasan buatan (AI) tersebut merupakan model AI pertama dari keluarga Gemini 2.0 milik mereka.
Namun untuk saat ini Gemini 2.0 Flash tersebut masih dirilis dala versi eksperimental.
Model AI tersebut merupakan suksesor dari Gemini 1.5 Flash yang sebelumnya diperkenalkan oleh google pada bulan Mei lalu.
Sebagai pembaruan dari sebelumnya, Gemini 2.0 Flash ini dilengkapi dengan kemampuan baru.
Gemini ini tidak hanya mendukung input multimodal seperti gambar, video, dan audio, melainkan juga mendukung output multimodal seperti gambar yang dibuat secara native.
Output tersebut memungkinkan untuk menggabungkan teks dengan audio multibahasa text-to-speech (TTS) yang dapat diarahkan (intonasi, gaya bicara, dan kecepatannya).
Selain itu, model AI tersebut juga disebut lebih cepat dan lebih murah untuk dijalankan dibanding dengan versi sebelumnya.
Gemini 2.0 Flas Jadi Model AI Paling Mumpuni
Melansir dari blog google, CEO Google, Sundar Pichai menggambarkan bahwa saat ini Gemini 2.0 Flash merupakan model AI paling mumpuni dari Google.
Gemini 2.0 Flash ini berhasil dibangun diatas Flash 1.5, yang merupakan model AI Google paling populer sejauh ini bagi para pengembang.
Model AI ini dikembangkan dengan meningkatkan kinerja pada waktu respons yang sama cepatnya.
Melansir dari laman resmi blog Google, berdasarkan data pengujian internal Google, Gemini 2.0 Flash Experimental juga mampu mengungguli Gemini 1.5 Pro.
Gemini versi terbaru tersebut mampu unggul dalam hal kemampuan pengodean, menyajikan fakta, matematika, penalaran, pembuatan gambar, dan analisis video.
Flash 2.0 ini juga dapat menggunakan aplikasi dan layanan pihak ketiga yang memungkinkan untuk memanfaatkan Google Search, mengeksekusi kode, dan lainnya.
Diketahui selama satu tahun terakhir, Google memang tengah menggencarkan pengembangan lebih banyak model AI Agentik.
Model AI Agentik ini disebut lebih mampu memahami dunia di sekitar pengguna, berpikir beberapa langkah ke depan, serta mengambil tindakan atas nama pengguna dengan pengawasan pengguna.
Salah satu model AI Agentik yang diperkenalkan Google adalah Project Astra pada bulan Mei lalu.
Project Astra merupakan sistem visual yang dapat mengidentifikasi objek, membantu pengguna menjelajahi dunia, hingga memberitau dimana pengguna meletakan kacamatanya.
Menurut Google, kehadiran Gemini 2.0 ini merupakan peningkatan yang sangat besar bagi Project Astra, diantaranya:
1. Dialog Lebih Baik
- Kemampuan bercakap-cakap dalam berbagai bahasa dan kombinasi bahasa.
- Pemahaman yang lebih baik terhadap aksen dan kata-kata tidak umum.
2. Penggunaan Alat Baru
- Integrasi dengan Google Search, Lens, dan Maps.
- Menjadikan Astra lebih fungsional sebagai asisten sehari-hari.
3. Memori yang Ditingkatkan
- Kemampuan mengingat lebih baik, dengan kontrol penuh di tangan pengguna.
- Dapat mengingat percakapan hingga 10 menit per sesi dan lebih banyak interaksi sebelumnya.
4. Latensi Lebih Rendah
- Fitur streaming baru dan pemahaman audio asli.
- Kemampuan memahami bahasa dengan latensi serupa percakapan manusia.
Ketersediaan Gemini 2.0 Flash
Saat ini, Gemini 2.0 masih dalam tahap eksperimental, namun pengguna sudah dapat menggunakannya dengan memilih model baru di aplikasi web Gemini.
Kehadiran Gemini 2.0 ini dikabarkan akan rilis pada awal tahun 2025 yang hadir di platform Google lainnya.
Flash 2.0 ini nantinya akan mendukung AI Overview atau ringkasan AI di Google Search, serta mendukung fitur AI di Workspace dan di tempat lainnya di Google.
Tidak hanya untuk pengguna, Google juga merilis sebuah API, Multimodal Live API, untuk membantu pengembang membangun aplikasi dengan fungsionalitas streaming audio dan video secara real-time.
Multimodal Live API ini memungkinkan pengembang untuk membuat aplikasi multimodal secara real-time dengan intput audio dan video dari kamera atau layar.
API tersebut juga turut mendukung integraso alat untuk menyelesaikan tugas, serta dapat menangani “pola percakapan alami” seperti interupsi.
Multimodal Live API ini sudah tersedia secara umum pada pagi ini Kamis, 12 Desember 2024.