Kecerdasan Buatan

Dall-E Vs. Tengah Perjalanan – Penghasil Gambar Manakah yang Berkuasa Tertinggi?

Diterbitkan 12 Maret, 2024

Gaurav Roy

Securities.io mempertahankan standar editorial yang ketat dan dapat menerima kompensasi dari tautan yang ditinjau. Kami bukan penasihat investasi terdaftar dan ini bukan nasihat investasi. Silakan lihat pengungkapan afiliasi.

Lanskap desain grafis mengalami pergeseran tektonik dengan diperkenalkannya DALL·E 1 dari OpenAI, yang menjadi sensasi pada Januari 2021. Mulai dari desainer grafis yang mempercepat proses ideasi, desainer interior yang menggunakan AI untuk mendapatkan inspirasi, hingga seniman yang memanfaatkan generator gambar AI untuk menciptakan karya seni, kita telah menyaksikan teknologi ini merambah hampir ke mana-mana di internet.

Faktanya, Midjourney V1 diperkenalkan pada Juli 2022, diikuti dengan peluncuran V6 pada Desember 2023, yang menunjukkan pesatnya laju inovasi. Kedua model tersebut telah menarik perhatian yang signifikan.

Kini, di tahun 2024, diskusi tentang DALL·E 3 dan Midjourney V6 mendominasi kolom komentar di platform media sosial dan YouTube. Mengingat hal ini, kami bertujuan untuk menyederhanakan pilihan untuk Anda.

Dalam artikel ini, kami akan membandingkan keduanya berdasarkan beberapa parameter, termasuk kinerjanya dalam menghasilkan berbagai jenis gambar, kemudahan penggunaannya, serta kelebihan dan kekurangannya secara keseluruhan. Mari kita mulai.

Kemampuan Pembuatan Gambar: DALL-E Vs Midjourney

Karena kita membandingkan dua pendukung pembuat gambar AI, kita perlu menggali lebih dalam kinerjanya ketika berhubungan dengan berbagai jenis gambar:

Gambar Fotorealistik

Ini adalah kasus penggunaan paling umum untuk generator gambar AI, dan berdasarkan banyaknya utas Reddit dan video YouTube dengan demonstrasi langsung, kami sampai pada kesimpulan bahwa DALL·E 3 memiliki sedikit keunggulan. Namun, preferensi ini bukan karena kemampuan pembuatan gambar DALL·E 3 lebih baik daripada Midjourney V6; melainkan lebih karena kemampuannya memahami konteks lebih baik daripada Midjourney VXNUMX.

Untuk mengujinya, kami menggunakan perintah, “Buatlah gambar fotorealistik dari seorang pengamen jalanan, seorang pria kulit hitam paruh baya yang memainkan saksofon di trotoar kota yang sibuk. Latarnya harus berupa jalan perkotaan dengan pejalan kaki, gedung-gedung tinggi, dan lampu jalan. Pelaku harus memiliki ekspresi konsentrasi dan semangat yang mendalam terhadap musiknya.”

Inilah yang dikembalikan DALL-E 3:

Hasil Dall-E

Gambar ini tidak fotorealistis dari sudut mana pun. Namun, gambar ini tetap sesuai dengan petunjuk dalam hal lain. Meskipun gambar yang dihasilkan bagus dalam hal pencahayaan dan tekstur, ketiadaan lampu jalan menunjukkan bahwa gambar tersebut tidak sepenuhnya memenuhi kriteria kami. Meskipun demikian, sebagian besar pengguna daring berpendapat sebaliknya, sehingga kami memutuskan untuk memberikannya manfaat dari keraguan. Sebagai contoh, berikut ini gambar paling fotorealistik pengguna Reddit (u/Algoartist) dapat menghasilkan:

Gambar Realistis Dall-E 3

Midjourney V6, meski tetap memberikan hasil yang mengesankan, menghasilkan gambar yang lebih condong ke arah estetika sinematik dan bergaya:

Hasil tengah perjalanan

Kami menyukai komposisi artistiknya, dan ia mengikuti arahan kami dengan jauh lebih akurat. Meskipun tidak tampak fotorealistis, hasilnya terbukti lebih baik daripada yang dikembalikan Dall-E.

Gambar Artistik dan Bergaya

Berdasarkan pendapat pengguna, Midjourney V6 mengungguli aplikasi lain dalam menghasilkan gambar artistik dan bergaya dengan menawarkan kontrol yang sangat detail atas proses pembuatan gambar. Kontrol ini memungkinkan pengguna untuk menyesuaikan rasio aspek, memilih algoritma tertentu, dan menjelajahi beragam gaya artistik, menjadikannya pilihan yang lebih disukai untuk tugas-tugas ini. Berikut contoh kontrol kreatif yang tersedia, ditunjukkan melalui gambar lama yang kami buat menggunakan Midjourney V5.2:

Petunjuk: Gambaran gembira dan hiper-realistis dari anak anjing Golden Retriever yang sedang bermain-main; menangkap kilauan bulu emasnya, binar matanya, dan gerakan dinamisnya, semuanya melalui lensa kamera profesional, –ar 1:1 –v 5.2 –style raw

Gambar AI Anjing

Berikut perintah lain yang kami gunakan untuk menghasilkan gambar melalui Midjourney: “Buatlah karya seni anime epik seorang penyihir di puncak gunung pada malam hari, yang mengucapkan mantra kosmik bertuliskan 'Difusi Stabil 3' ke langit yang gelap.”

Gambar penyihir Tengah Perjalanan

Meskipun terlihat indah, sayangnya tidak disebutkan "Stable Diffusion 3", yang cukup mengecewakan. Bagaimanapun, komposisi dan estetika keseluruhannya terasa luar biasa, meskipun kesetiaannya terhadap gaya seni anime yang sesungguhnya patut dipertanyakan.

Inilah yang dikembalikan DALL-E 3:

Gambar Penyihir Dall-E 3

Sekali lagi, hasil kami bertentangan dengan opini pengguna, dan kami berhasil mencapai seni bergaya anime yang sempurna, bahkan dengan tulisan "Stable Diffusion 3" yang tercetak dengan jelas di gambar (meskipun sedikit salah eja). Lebih lanjut, estetikanya juga sesuai dengan gaya anime.

Tekstur dan Pola Mulus

Baik DALL-E 3 dan Midjourney V6 bagus dalam menghasilkan tekstur dan pola mulus, yang bisa sangat membantu dalam sejumlah domain, seperti desain tekstil dan barang pecah belah.

Berikut perintah yang kami gunakan untuk menganalisis seni AI dalam kasus penggunaan ini: "Ciptakan tekstur wallpaper bunga vintage yang mulus. Desainnya harus menampilkan bunga dan daun yang digambar tangan secara detail dalam warna pastel dengan latar belakang lembut, yang membangkitkan gaya klasik dan elegan dari awal abad ke-20."

Dan inilah Midjourney V6 yang dikembalikan kepada kami:

Desain Tengah Perjalanan

DALL·E 3 menghasilkan gambar ini:

Desain Dall-E 3

Kedua alat tersebut menghasilkan hasil yang mengesankan. Meskipun Midjourney melakukan pekerjaan yang hebat di sini, hasil DALL-E 3 memberikan nuansa yang lebih organik dan sesuai dengan ekspektasi kami.

Dall-E Vs. Tengah Perjalanan: Evaluasi Kinerja

Sekarang setelah kita melalui pengalaman langsung menggunakan dua generator gambar AI dan pendapat banyak pengguna, sekarang mari kita mengevaluasi kinerja mereka dari sudut pandang obyektif:

Konsistensi dan Kepatuhan yang Cepat

Dalam hal konsistensi dan eksekusi yang tepat sesuai maksud Anda (bukan hanya apa yang Anda tulis), DALL-E 3 jelas merupakan pemenangnya. Berkat pemahaman bahasa alami OpenAI yang canggih, DALL-E 3 menginterpretasikan dan mengeksekusi perintah relasional yang kompleks dengan akurasi tinggi. Hal ini secara signifikan meningkatkan keandalannya bagi pengguna yang menginginkan presisi dan kontrol yang lebih tinggi atas gambar yang dihasilkan. Oleh karena itu, DALL-E XNUMX bisa menjadi pilihan utama Anda untuk proyek profesional atau membuat aset spesifik.

Di sisi lain, Midjourney V6, meskipun mampu menghasilkan gambar yang memukau dan mengesankan secara visual, tidak selalu dapat menangani adegan yang kompleks atau banyak elemen. Hasilnya dapat bervariasi, terkadang memerlukan beberapa iterasi perintah Anda untuk mencapai hasil yang diinginkan. Meskipun demikian, variabilitas ini dapat menguntungkan ketika Anda mencari penemuan tak terduga dan hasil unik serta tak terduga yang memicu kreativitas.

Klik di sini untuk perbandingan mendalam tentang ChatGPT, Gemini, dan Grok.

Keanekaragaman dan Kualitas Gambar yang Dihasilkan

DALL-E 3 dan Midjurney V6 unggul dalam menghasilkan gambar berkualitas tinggi dalam berbagai gaya, genre, dan subjek. Namun, DALL-E 3 menonjol karena konsistensinya dalam menghasilkan gambar yang selaras dengan maksud pengguna dan menawarkan opsi yang memenuhi harapan dengan lebih tepat.

Di sisi lain, Midjourney V6 unggul dalam menghadirkan keragaman yang lebih luas, terutama ketika ekspektasi pengguna lebih luas atau ketika pengguna mengeksplorasi ide-ide baru. Pembaruan V6 terbaru telah meningkatkan kemampuan kustomisasi dan gaya Midjourney, membuatnya semakin menarik bagi para seniman, desainer, dan kreator yang mencari alat untuk menjelajahi batas-batas estetika baru.

Keramahan Pengguna dan Aksesibilitas

DALL-E mendapatkan keuntungan dari integrasinya dengan ChatGPT OpenAI, yang memungkinkan percakapan untuk menyempurnakan perintah, tidak seperti pendekatan Midjourney yang lebih otonom. Integrasi ini memfasilitasi akses langsung di dalam ChatGPT, sehingga meningkatkan keramahan seluler. Selain itu, DALL-E menawarkan opsi untuk membuat GPT Kustom untuk tugas-tugas berulang, yang menyederhanakan proses pembuatan gambar agar lebih cepat dan ramah pengguna.

Dibandingkan dengan DALL-E, Midjourney beroperasi melalui Discord, yang mungkin sesuai atau tidak sesuai dengan preferensi Anda, meskipun komunitasnya yang dinamis dapat menjadi keuntungan yang signifikan. Selain itu, DALL-E menawarkan integrasi dengan perangkat lunak lain melalui Zapier, meningkatkan keserbagunaannya, sebuah fitur yang melengkapi dukungan API yang disediakan oleh kedua generator seni AI.

Klik di sini untuk daftar ekstensi ChatGPT terbaik.

Dall-E Vs. Tengah Perjalanan: Putusan

Parameter	DALL-E3	Pertengahan perjalanan V6
Fotorealisme	Sangat baik	Besar
Gaya Artistik	baik	Sangat baik
Kepatuhan yang Cepat	Sangat baik	baik
Keramahan Pengguna	Luar biasa (integrasi ChatGPT)	Bagus (berbasis perselisihan)
Rendering Teks	Sangat baik	baik
Konsistensi	Sangat baik	baik
Harga	$20/bulan (ChatGPT Plus) atau bayar per gambar	$10/bulan (200 gambar) hingga $120/bulan (Pro)
Komunitas	Forum AI umum	Komunitas Perselisihan yang berdedikasi
Fitur Unik	Akses API, integrasi dengan alat OpenAI lainnya	Fitur –tile bawaan untuk tekstur mulus, gaya yang dapat disesuaikan

Saran kami? Dalam kebanyakan situasi, DALL-E 3 akan memenuhi kebutuhan Anda, dan bagian terbaiknya adalah, dengan harga $20, Anda mendapatkan akses ke semua penawaran OpenAI, termasuk ChatGPT. Jika Anda masih ragu, cobalah uji coba gratis Midjourney untuk melihat apakah lebih sesuai dengan kebutuhan Anda. Seiring waktu, Anda akan secara alami mengembangkan pemahaman tentang alat mana yang lebih sesuai dengan visi dan alur kerja Anda.

Klik di sini untuk mempelajari semua tentang investasi dalam kecerdasan buatan (AI).

Topik-topik terkait:Generator seni AI Kecerdasan Buatan Lempeng di tengah perjalanan

Berikutnya

Dengan Munculnya AI, Robotika Menjadi Sangat Mengesankan

Jangan Miss

Elon Musk vs OpenAI: Mengungkap Pertarungan Hukum Atas AGI

Gaurav Roy

Gaurav mulai memperdagangkan mata uang kripto pada tahun 2017 dan telah jatuh cinta dengan dunia kripto sejak saat itu. Ketertarikannya pada segala hal tentang kripto mengubahnya menjadi seorang penulis yang berspesialisasi dalam mata uang kripto dan blockchain. Segera dia menemukan dirinya bekerja dengan perusahaan kripto dan outlet media. Dia juga penggemar berat Batman.

Sekuritas.io

Dall-E Vs. Tengah Perjalanan – Penghasil Gambar Manakah yang Berkuasa Tertinggi?

Kecerdasan Buatan

Dall-E Vs. Tengah Perjalanan – Penghasil Gambar Manakah yang Berkuasa Tertinggi?

Daftar Isi