Layaknya aplikasi screenshot, Recorder menggunakan Gemini Nano dengan kemampuan multimodal pada seri Pixel 9. Google membagikan element lebih lanjut tentang integrasi awal pekan ini.
Secara keseluruhan, Recorder percaya bahwa penambahan dukungan Gemini Nano untuk cuplikan tahun lalu telah berkontribusi pada “peningkatan signifikan dalam keterlibatan aplikasi dan retensi pengguna secara keseluruhan.” Secara khusus, “Pengguna menggunakan fitur ringkasan AI baru rata-rata dua hingga lima kali per hari, dan jumlah rekaman yang disimpan secara keseluruhan meningkat sebesar 24%.”
Pada seri Pixel 9, Recorder menggunakan Gemini Nano dengan kemampuan multi-modal, memungkinkan enter gambar dan audio selain teks. Mannequin ini “jauh lebih besar” dibandingkan mannequin sebelumnya – khususnya, “hampir dua kali lipat ukurannya” – dan “lebih mumpuni, lebih akurat, dan lebih terukur”.
Bagi pengembang, ini berarti kualitas out-of-the-box yang tidak memerlukan penyesuaian, yang berarti penggunaan lebih mudah dan dukungan untuk kasus penggunaan yang lebih kreatif…
Google belum benar-benar merinci kemampuan multi-modal Gemini Nano, tetapi disebutkan dalam keynote bahwa itu “tiga kali lebih kuat dan canggih” daripada versi asli Pixel 8 Professional. Tahun lalu, ada laporan teknis tentang seri Gemini 1.0, yang mencakup dua versi Gemini 1.0 Nano: “parameter 1,8B (Nano-1) dan 3,25B (Nano-2), masing-masing menargetkan perangkat dengan memori rendah dan memori tinggi Kami tidak tahu apakah versi Multimodal baru adalah bagian dari seri Gemini 1.5, atau pengembangannya merupakan bagian dari cabang yang berbeda.
Terlepas dari itu, dukungan token mannequin yang diperluas memungkinkan Perekam “meringkas catatan yang lebih panjang dari sebelumnya.” Hal lain yang dibawa oleh multimodalitas adalah “tata bahasa sebagai metrik baru untuk menilai kualitas penalaran”.
Pada saat yang sama, tim Recorder dapat mengembangkan pekerjaan yang sudah ada menggunakan multi-modal Gemini Nano:
Mengintegrasikan Gemini Nano dengan multimodalitas memerlukan penyesuaian lainnya. Namun, pengembang Recorder dapat menggunakan kumpulan knowledge mannequin Gemini Nano asli yang telah disempurnakan sebagai foundation, sehingga menyederhanakan proses pengembangan.
Selain aplikasi Perekam Suara di Pixel Watch 3, yang mentransfer file audio ke ponsel untuk transkripsi, Google telah mengembangkan “setidaknya dua fitur GenAI lainnya untuk membantu orang mendapatkan kembali waktu mereka.” Hal ini telah dibuktikan secara inside untuk mendapatkan umpan balik awal.
FTC: Kami menggunakan tautan afiliasi otomatis untuk memperoleh pendapatan. Lagi.