Mengenal SR3 & CDM Alat Super Canggih Google untuk Memperbaiki Gambar

Mahsun saleh S.Si

0 Comment

Link

Anda mungkin telah melihat film sci-fi atau acara televisi di mana protagonis meminta memperbesar gambar dan meningkatkan hasil untuk mengungkap wajah, atau plat nomor adalah tampak sangat mengagumkan, pada dasarnya apa yang terjadi adalah detail gambar ditambahkan secara buatan apa yang kamera tidak tangkap, menggunakan beberapa dugaan super-pintar berdasarkan gambar lain yang tampak mirip. Teknik ini disebut sintesis gambar alami oleh Google, dan dalam skenario khusus ini, menghasilkan gambar resolusi super. 

Anda memulai dengan foto kecil, yang kabur, piksel, dan hasilnya sesuatu yang tajam, jelas, dan tampak alami. Mungkin tidak cocok dengan aslinya tepat sempurna, tetapi cukup dekat untuk terlihat nyata oleh mata manusia. Penelitian Google dengan hasil dua alat AI baru untuk pekerjaan itu.

Pertama disebut SR3, atau resolusi super melalui penyempurnaan berulang, dan itu bekerja dengan menambahkan sesuatu ke suatu gambar dan kemudian membalikkan proses dan mengambilnya sebanyak para editor gambar mencoba menajamkan lagu liburan Anda. “Model difusi bekerja dengan merusak data dengan secara progresif lalu menambahkan kebisingan Gaussian, perlahan-lahan memusnahkan detail dalam data sampai menjadi kebisingan murni” jelaskan ilmuwan penelitian Jonathan Ho dan insinyur perangkat lunak Chitwan Melalui serangkaian perhitungan probabilitas berdasarkan pada basis data gambar yang luas dan beberapa pembelajaran mesin, SR3 dapat membayangkan seperti apa bentuk gambar resolusi rendah yang rapi. 

Kedua adalah CDM, atau model difusi yang mengalir. Google menggambarkan ini sebagai “Pipa” melalui model difusi termasuk SR3 yang dapat diarahkan untuk meningkatkan resolusi gambar berkualitas tinggi. Dibutuhkan model peningkatan dan membuat gambar yang lebih besar dari itu, dan Google telah menerbitkan alat untuk ini, yaitu CDM.

(Penelitian Google) Dengan menggunakan model peningkatan yang berbeda pada resolusi yang berbeda, pendekatan CDM mampu mengalahkan metode alternatif untuk mem-upsizing gambar, kata Google. Mesin AI baru diuji pada Imagenet, basis data raksasa dari gambar pelatihan yang biasa digunakan untuk penelitian pengenalan objek visual. Hasil akhir SR3 dan CDM mengesankan. Dalam tes standar dengan 50 sukarelawan manusia, gambar-gambar wajah manusia yang dihasilkan SR3, keliru 50% untuk foto nyata dan mengingat algoritma yang sempurna akan diharapkan untuk mencapai skor 50 persen, itu mengesankan. Layak untuk mengulangi bahwa gambar yang ditingkatkan ini bukan kecocokan yang tepat untuk dokumen asli, tetapi mereka dengan hati-hati menghitung simulasi berdasarkan beberapa matematika probabilitas tingkat lanjut.

Google mengatakan pendekatan difusi menghasilkan hasil yang lebih baik daripada opsi alternatif, termasuk jaringan generatif (GANS) yang mengadu dua jaringan saraf satu sama lain untuk memperbaiki hasil. (Penelitian Google) Google menjanjikan lebih banyak dari mesin AI baru dan teknologi terkait – tidak hanya dalam hal menaikkan gambar wajah dan benda-benda alami lainnya, tetapi juga dalam bidang pemodelan probabilitas lainnya. “Kami sangat senang untuk menguji batas-batas model difusi untuk berbagai macam masalah pemodelan generatif,” kata tim.

Jurnal Refrensi:

  • Chitwan Saharia, Jonathan Ho, William Chan, Tim Salimans, David J. Fleet, Mohammad Norouzi. 2021. Image Super-Resolution via Iterative Refinement. ARXIV: arXiv:2104.07636 (eess) https://arxiv.org/abs/2104.07636.
  • https://ai.googleblog.com/2021/07/high-fidelity-image-generation-using.html

Tags:

Share:

Related Post

Tinggalkan komentar