Saya telah mencoba kemampuan pengeditan gambar dalam model AI generatif terbaru Google, dan Anda juga bisa. Bernama Gemini 2.5 Flash Image, It peningkatan Kemampuan untuk mengedit foto Anda secara asli di Gemini.
Penggemar AI menyebutnya sebagai model “nano pisang”, didorong oleh serangkaian penggoda dari Google eksekutif. Google telah banyak berinvestasi dalam model media generatifnya tahun ini, menjatuhkan versi terbaru dari model generator gambar dan videonya pada konferensi pengembang I/O tahunan. Generator video AI Google Veo 3 terpana dengan audio yang disinkronkan, yang pertama di antara raksasa AI. Dan pencipta telah membuat lebih dari 100 juta video AI dengan alat pembuat film AI Google, Flow.
Saya telah menghabiskan banyak waktu menguji perangkat lunak kreatif AI, dan saya senang melihat penurunan terbaru Google di tengah semua keriuhan pisang. Tetapi pengujian saya terhadap gambar flash 2.5 menunjukkan bahwa hanya karena sesuatu memiliki pintu masuk yang mencolok tidak berarti itu akan selalu hidup sesuai hype. Beginilah pengalaman saya dengan pisang Gemini Nano pergi: yang baik, yang buruk dan yang membuat frustrasi.
Apa yang berhasil
Model Gemini Bananas sangat pandai menambahkan elemen ke gambar yang ada, memadukan elemen yang dihasilkan AI dengan baik ke dalam gambar apa pun yang Anda patah. Ini juga mempertahankan tingkat konsistensi karakter yang stabil – yang berarti orang -orang di foto saya tidak terlalu terdistorsi atau miring setelah melalui pemrosesan AI. Keduanya adalah perbedaan penting untuk program gambar AI, dan sesuatu yang dikatakan Google telah bekerja untuk meningkatkan.
Anda dapat melihat kedua karakteristik ini dalam gambar saudara perempuan saya dan saya. Penampilan umum kami tidak berubah dalam versi yang diedit (kanan), memamerkan konsistensi karakter itu. Saya meminta Gemini untuk menambahkan saudari ketiga yang tampak mirip dengan kami berdua, yang sangat baik dengan menambahkan wanita ketiga di antara kami berdua.
Selamat datang di keluarga, adik AI yang tampak akurat.
Saya juga cukup terkesan dengan seberapa cepat Gemini bisa memuntahkan gambar yang sudah selesai. Di mana saja di bawah satu menit mendapat bintang emas dari saya, dan Gemini secara teratur menangani permintaan dalam waktu kurang dari 15 detik. Saya juga menghargai bagaimana itu menambahkan tanda air ke semua gambar yang dibuat dan diedit-bahkan jika saya tidak suka bagaimana perusahaan teknologi telah merusak emoji berkilau untuk AI, sangat penting untuk memiliki beberapa penanda konten yang dihasilkan AI. Pekerjaan Synthid dan di belakang layar Google juga membantu membedakan konten AI dari citra yang dibuat manusia.
Gemini juga pandai dalam penciptaan gambar AI grosir, tetapi saya sarankan untuk menggunakan generator gambar Imagen 4 atau lain-lain-mereka memiliki lebih banyak kontrol dan pengaturan langsung yang membuat Anda lebih dekat dengan apa yang Anda inginkan dengan lebih sedikit pekerjaan.
Apa yang sebenarnya tidak berhasil
Ada batasan serius untuk pisang Gemini. Ini secara otomatis menghasilkan gambar persegi, dan permintaan tindak lanjut meminta gambar untuk diadaptasi menjadi dimensi lain diabaikan atau gagal.
Saya juga memperhatikan bahwa Gemini mengurangi resolusi banyak foto saya. Saya terutama mengambil foto dengan iPhone 16 saya, yang memiliki kamera bintang, tetapi setelah melalui model Bananas Gemini, detail -detail halus itu sering kabur. Itu menjengkelkan dan tidak akan menang atas fotografer mana pun.
Terlepas dari permintaan saya untuk mencerahkan cincin target, foto asli (kiri) memiliki lebih banyak kekayaan dan tekstur daripada yang diedit AI (kanan).
Saya mencoba berulang kali untuk membuat Gemini menangani pengeditan foto yang akan sulit bagi saya untuk dilakukan secara manual. Itu satu area dalam pengeditan foto di mana AI seharusnya unggul-mengotomatiskan pengeditan duniawi tetapi intensif detail. Sayangnya, Gemini benar -benar berjuang dengan kepatuhan yang cepat di sini, yang berarti itu tidak melakukan apa yang saya minta.
Saya mencoba berkali -kali untuk membuat Gemini menghapus refleksi dari sekejap poster film Friday yang lebih aneh, tetapi mereka tetap dengan keras kepala. Dan semakin saya mencoba membuatnya untuk menghapus refleksi, semakin buruk kualitas gambar menjadi setiap prompt. Teks yang dulu jelas pada akhirnya tidak terbaca setelah saya akhirnya menyerah, belum lagi kerusakan yang tidak disengaja dan tampak menakutkan yang dilakukan pada wajah Lindsey Lohan dan Jamie Lee Curtis.
Gemini nano pisang berjuang untuk menghasilkan gambar dalam dimensi yang berbeda. Mengukur dan memangkas gambar adalah proses pengeditan foto inti, tetapi Gemini tidak – atau tidak dapat – menangani pedoman ukuran sederhana di petunjuk saya.
Yang saya inginkan hanyalah Gemini untuk menghapus refleksi di sudut kanan atas poster itu, tetapi sebaliknya itu melengkungkan lini dan wajah tag film.
Saya menghubungi Google tentang masalah resolusi dan dimensi dan juru bicara mengatakan perusahaan teknologi “sadar dan aktif mengerjakan kedua masalah. Ini merupakan pembaruan besar dari model kami sebelumnya tetapi kami akan terus meningkatkan model.”
Secara keseluruhan, pisang Gemini Nano membuktikan kepada saya bahwa Google serius untuk terus mendominasi di media generatif. Tetapi memiliki jebakan yang signifikan, dengan terlalu besar fokus untuk menghasilkan elemen baru daripada menggunakan AI untuk meningkatkan dan mengubah masalah foto umum. Untuk saat ini, model nano pisang paling cocok untuk penggemar Gemini yang ingin melakukan pengeditan besar dengan cepat. Bagi kita yang mencari alat yang lebih tepat, kita harus menunggu pembaruan besar Google berikutnya atau menemukan program lain.
Gemini Nano Pisang Ketersediaan, Harga dan Privasi
Anda tidak perlu melakukan apa pun untuk mengakses model baru; Secara otomatis ditambahkan ke model flash Gemini 2.5 dasar. Gemini tersedia secara gratis, dengan lebih banyak model dan topi penggunaan yang lebih tinggi tersedia dalam rencana AI Google mulai $ 20 per bulan.
Jika Anda seorang pelanggan yang membayar, Anda mungkin juga dapat mengakses model melalui Google AI Studio. Dari sana, yang harus Anda lakukan adalah mengunggah gambar dan mengetikkan prompt Anda. Setiap prompt digunakan di mana saja dari satu hingga dua ribu token, tergantung pada tingkat detail yang diperlukan. Pengguna Adobe Express dan Firefly juga dapat mengakses model baru sekarang.
Google Kebijakan Privasi Gemini mengatakan dapat menggunakan informasi yang Anda unggah untuk meningkatkan produk AI -nya, itulah sebabnya perusahaan merekomendasikan untuk menghindari pengunggahan informasi yang sensitif atau pribadi. Perusahaan Kebijakan Penggunaan Larangan AI Juga melarang penciptaan materi ilegal atau kasar.
Untuk lebih lanjut, lihat generator gambar AI terbaik dan semuanya diumumkan di acara Made by Google Pixel 10.