Li Fei Fei, Ph.D. Sumber image South China Morning Post, 5 Agustus 2024. Image credit: SCMP Composite/Huxiu/Sohu
Li Fei Fei, yang sekarang ini dijuluki "the Godmother of AI", dilahirkan 3 Juli 1976 di Beijing, China, lalu tumbuh dewasa di Chengdu, provinsi Sichuan, China barat daya. Pada usia 16 tahun (1992), Li Fei Fei dan mamanya (Kuang Ying) beremigrasi ke Amerika untuk berkumpul kembali dengan papanya (Li Shun) yang telah beremigrasi lebih dulu ke Parsippany, New Jersey, Amerika, ketika Fei Fei berusia 12 tahun.
Berbeda dari kondisi keluarganya yang makmur ketika masih berdiam di China, di New Jersey, Amerika, mereka hidup sebagai suatu keluarga imigran yang miskin. Mereka tinggal di sebuah flat kecil dengan hanya satu kamar tidur. Tekad Li Fei Fei untuk keluar dari kemiskinan, mendorongnya masuk sekolah untuk murid-murid berusia 11 tahun ke atas (SMP-SMA), sementara juga bekerja sebagai seorang pramusaji dan pembersih rumah.
Guru matematika Li Fei Fei di sekolahnya, yang bernama Bob Sabella, melihat bakat-bakatnya yang luar biasa dalam mata pelajaran fisika dan matematika. Sang guru ini senantiasa memberi dorongan dan dukungan kepadanya. Li tetap ingat suatu momen: sementara mendiskusikan para penulis fiksi-fiksi sains dengan Sabella, dia merasakan untuk pertama kalinya bahwa ada seorang Amerika yang melihatnya lebih dari sekadar seorang imigran China. Ini membangkitkan kepercayaan dirinya dan martabatnya.
Dalam bulan November 2023, Li Fei Fei menerbitkan otobiografinya yang diberi judul The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI. Katanya, "Aku seorang pemalu, tidak piawai dalam mengekspresikan diriku sendiri. Tapi aku menegaskan bahwa aku harus menerbitkan sebuah buku karena bidang AI tidak dapat tidak memiliki suara-suara perempuan."
Meski dalam otobiografinya ini Li Fei Fei berkisah tentang "ketidakadilan, penderitaan dan penghinaan" yang telah dialaminya, dia melihat bukunya ini pada dasarnya adalah "selembar surat cinta kepada sains yang aku cintai." Li menegaskan bahwa dia bukan saja seorang saintis AI, tapi juga seorang humanis. Katanya, "I am walking between being a scientist and a humanist."
Li Fei Fei masuk kuliah di Princeton University pada 1995 dengan mendapatkan beasiswa, lalu meraih gelar Bachelor of Arts (B.A.) dengan major di bidang fisika dari universitas ini tahun 1999. Studi lanjutnya ditempuh di California Institute of Technology yang memberinya gelar Master dalam bidang enjiniring elektris tahun 2001. Empat tahun kemudian, 2005, dia meraih gelar Doctor of Philosophy (Ph.D.) dalam bidang yang sama, dari institut yang sama. Studi-studi lanjutnya ini ditopang oleh National Science Foundation Graduate Research Fellowship dan The Paul and Daisy Soros Fellowship for New Americans.
Disertasi Ph.D. yang ditulisnya berjudul "Visual Recognition: Computational Models and Human Psychophysics", di bawah bimbingan supervisor pertama Pietro Perona dan supervisor kedua Christof Koch. Selama studi doktoralnya ini, Li Fei Fei membuat kontribusi-kontribusi yang signifikan kepada teknik pembelajaran "hanya dengan satu contoh" ("the one-shot learning technique"), yang membuatnya dikenal dalam komunitas sains AI. Teknik ini, dalam suatu Machine Learning, dapat membuat prediksi-prediksi yang didasarkan pada data yang minimal atau pada satu contoh saja, dan penting bagi visi komputer ("computer vision") dan Natural Language Processing (NLP).
Selain gelar akademik Ph D., Li juga mendapatkan gelar Ph.D. Kehormatan (Honorary Ph.D.) dari Harvey Mudd College untuk bidang enjiniring.
Setelah menyandang gelar Ph.D., Li bekerja sebagai Assistant Professor di Departemen Enjiniring Komputer dan Elektris di University of Illinois Urbana-Champaign dari 2005 sampai 2006. Selanjutnya dia menjadi Assistant Professor di Computer Science Department Princeton University. Mulai 2009 dia masuk ke Stanford University dengan jabatan sebagai Assistant Professor, lalu naik jabatan menjadi Associate Professor di 2012, kemudian menjadi Professor penuh di 2018. Untuk selanjutnya, Universitas Stanford menjadi basis akademik yang kokoh bagi Prof. Li Fei Fei, Ph.D.
Li Fei Fei menjadi seorang saintis terkenal di bidang AI lewat banyak karya dan kegiatannya. Antara lain, di Stanford University Li bekerja sebagai direktur Stanford Artificial Intelligence Lab (SAIL) dari 2013 hingga 2018. Bersama John Etchemendy, bekas kepala Universitas Stanford, Li, di tahun 2019, menjadi direktur pendiri inisiatif yang setingkat dengan universitas yang diberi nama Human-Centered AI Institute (HAI).
HAI menjalankan riset dan berbagai kegiatan lain yang bertujuan untuk meningkatkan pengembangan-pengembangan dan aplikasi-aplikasi AI yang bermanfaat bagi manusia, "human-centered". Di bawah kepemimpinan Li, institut ini difokuskan pada kerjasama lintas ilmu untuk menggabung dan membagi kecakapan-kecakapan dari bermacam-macam bidang keilmuan sebagai respons terhadap isu-isu teknologis, sosial dan etis yang ditimbulkan oleh AI. Isu-isu seperti keadilan, kejujuran, privasi, disinformasi dan demokrasi semuanya adalah aspek-aspek penting dari HAI.
Di dalam HAI, Fei Fei menyatukan dokter-dokter, etikus-etikus, ekonom-ekonom, teknolog-teknolog, dan para pembuat kebijakan-kebijakan publik untuk mengejar dan mencapai AI yang berpusat pada manusia. Pendek kata, HAI bertujuan untuk memperkuat riset-riset yang menggunakan teknologi baru, edukasi dan kebijakan di bidang AI demi kebaikan masyarakat dan memajukan kondisi insani.
Selama lebih dari 5 tahun belakangan ini, HAI membangun kolaborasi dengan Kongres, Senat, Gedung Putih, industri dan universitas-universitas lain untuk menciptakan The National AI Research Resource atau NAIRR Amerika.
Selama masa cuti sabatikalnya dari Universitas Stanford, Januari 2017 hingga musim gugur 2018, Li bergabung dengan Google Cloud sebagai saintis utama AI/ML dan Wakil Ketua. Di Google ini, tim Li fokus pada usaha demokratisasi teknologi AI, dan menurunkan hambatan-hambatan untuk para pebisnis dan pengembang masuk ke bidang AI, termasuk pengembangan produk seperti AutoML. Selain itu, Li juga berperan di Google dalam membentuk strategi AI untuk perusahaan ini. Selama masa jabatannya di Google, Li mengekspresikan kebutuhan untuk mengembangkan AI yang beretika, aman dan bertanggungjawab, dan pentingnya diversitas dan inklusi dalam komunitas-komunitas AI.
Li Fei Fei mengungkapkan bahwa di Google Cloud, dia untuk pertama kalinya menyadari bahwa suatu teknologi, teknologi AI, yang semula sebagai sesuatu yang personal bagi dirinya, sebagai suatu pengejaran kuriositas dan pengetahuan, kini telah berubah menjadi suatu kekuatan bagi perubahan masyarakat dan dunia.
Ya, dalam seluruh karirnya di dunia teknologi AI, Li Fei Fei memainkan fungsi sebagai pembela, pendukung dan penganjur yang lantang bagi pengembangan AI yang beretika, AI yang bermoral. Dia meminta lebih banyak keanekaragaman dan pengikutsertaan dalam riset-riset AI, dan bekerja untuk memastikan bahwa teknologi-teknologi AI dikembangkan dan dikerahkan dengan bertanggungjawab. Usaha-usahanya telah menjadi alat dalam membangun kesadaran tentang dampak-dampak dan implikasi-implikasi etis dari AI, dan dalam mendorong keadilan, kejujuran, kesetaraan, transparansi, dan pertanggungjawaban, yang menjadi bagian terpenting dan tak dapat dilepaskan dari karya-karyanya.
Terkait dengan kesetaraan dan keadilan dalam studi-studi bidang AI, Li Fei Fei menyatakan, misalnya, bahwa "Pelajar-pelajar pergi untuk menghadiri suatu konferensi AI, dan mereka melihat 90% dari pengunjung adalah orang-orang dari gender yang sama. Juga, mereka tidak melihat orang Afrika-Amerika yang hampir sama jumlahnya dengan remaja-remaja laki-laki kulit putih." Penting diketahui, Biro Statistik Pekerja Amerika memproyeksikan pertumbuhan lapangan kerja di bidang riset sains komputer sebesar 19% pada 2026; namun, kalangan perempuan mendapatkan hanya 18% dari gelar Bachelor di bidang sains komputer yang dikeluarkan di seluruh Amerika.
Pada tahun 2017, Li Fei Fei, bersama bekas mahasiswinya Olga Russakovsky, mendirikan organisasi pendidikan non-profit AI4ALL ("AI for All"), yang membuka kursus-kursus Stanford AI Laboratory bagi murid-murid SMP-SMA. Organisasi ini didedikasikan untuk mendorong perempuan-perempuan muda dan murid-murid kalangan minoritas untuk mengeksplorasi dan memilih sains komputer sebagai suatu arah dan tujuan riset di masa depan. Sebagai suatu lembaga non-profit, AI4ALL didirikan untuk membereskan ketidakseimbangan gender yang terus saja terjadi dan bertahan dalam bidang AI.
Sangat mungkin, kontribusi yang diketahui paling baik dari Li Fei Fei untuk AI adalah, sejauh ini, pendirian ImageNet, yakni suatu dataset skala sangat besar fondasional yang menyimpan citra-citra ("images") yang diberi label, yang memberi formulasi-formulasi perbaikan-perbaikan dan penyempurnaan-penyempurnaan dalam visi komputer dan DL. Merancang konsep-konsep database ImageNet, yang dijuluki sebagai "Mata AI", "the Eye of AI", telah dimulai Li tahun 2006. Langkah Li ini meletakkan landasan bagi AI generatif.
AI generatif adalah suatu tipe AI yang fokus pada penciptaan atau pelahiran ("generate") konten baru yang orisinal seperti citra-citra, video-video, musik, teks dan data. Lewat pemahaman dan penemuan pola-pola dan struktur-struktur dari dataset-dataset yang besar, lalu pengetahuan ini digabung, sistem AI generatif akan menghasilkan data sintetis baru, atau data artifisial baru, yang serupa dengan data orisinal. Data sintetis adalah data yang dihasilkan secara artifisial, data buatan, yang menyerupai data dunia nyata, tapi tidak dikoleksi dari kejadian-kejadian, individu-individu atau sistem-sistem yang aktual.
AI generatif memiliki kemampuan untuk menciptakan konten dengan luar biasa cepat, dan untuk memahami bagaimana manusia mempersepsi konten yang telah diciptakannya. Kini apa yang dapat kita lakukan adalah kita dapat menguji konten tersebut dengan memperhadapkannya pada "synthetic audience" atau "audiens artifisial" atau "audiens sintetis" untuk melihat bagaimana mereka berpikir dan merasakannya. Audiens sintetis mengacu ke suatu grup individu-individu yang disimulasi, yang memiliki karakteristik, perilaku dan pilihan-pilihan artifisial atau buatan.
ImageNet, yang diluncurkan 2007, sebagai database, berisi 15 juta citra atau gambar yang dikategorisasi ke dalam 22.000 kelas-kelas objek-objek dan hewan-hewan, dan diberi anotasi oleh lebih dari 48.000 kontributor yang berasal dari 167 negara. Dataset jenis ini dirancangbangun bertahun-tahun untuk memungkinkan pelatihan-pelatihan model-model AI dengan tingkat kedalaman dan akurasi yang sebelumnya tidak dapat dicapai.
Gudang-gudang besar digital ImageNet yang menyimpan citra-citra berlabel telah menjadi sangat esensial bagi terobosan-terobosan di bidang AI mutakhir, dalam pelatihan wahana-wahana otonomus seperti "self-driving cars" untuk bernavigasi dalam lingkungan mereka, dan bagi model-model AI untuk dengan benar mengenali objek-objek dari pancingan-pancingan, petunjuk-petunjuk dan rangsangan-rangsangan visual ("visual prompts") yang perlu diberi respons, ditindaklanjuti dan diproses. Teknologi visi komputer, dengan demikian, mengalami kemajuan besar dalam hal bagaimana mengidentifikasi objek-objek visual.
Tantangan untuk berkompetisi yang diajukan ImageNet setiap tahun, yang dinamakan ImageNet Large Scale Visual Recognition Challenge, telah menjadi suatu faktor besar dalam mendorong kemajuan dan pengembangan dalam visi komputer. Kompetisi ini membuat para peneliti terus-menerus mengembangkan algoritma-algoritma baru yang diuji untuk memastikan atau menjamin munculnya revolusi-revolusi yang beranekaragam dalam kemampuan AI untuk mengenali dan memahami data visual.
Dalam tahun 2012, suatu jejaring neural buatan ("Artificial Neural Network") yang dinamakan AlexNet telah menimbulkan gelombang-gelombang kejut di seluruh komunitas riset AI ketika platform ini menunjukkan kinerja yang mengesankan yang melampaui tipe-tipe model-model lain, dan memenangkan kompetisi ImageNet. Dari situ, jejaring neural buatan (yang meniru jejaring neural otak manusia) lepas landas, dengan diberi daya oleh sejumlah sangat besar data pelatihan gratis yang sekarang tersedia di Internet dan GPUs (Graphics Processing Units, chip-chip komputer yang diberi daya tinggi) yang mengirim daya dan kekuatan komputer yang belum tersedia sebelumnya. Tiga belas hingga empat belas tahun sejak peluncuran ImageNet, para peneliti visi komputer makin menguasai teknologi "object recognition" dan "video generation".
Yang paling mutakhir dari banyak usaha dan kegiatan Li Fei Fei adalah pendirian suatu start-up World Labs, April 2024. World Labs menciptakan pemandangan-pemandangan 3D yang para pengguna dapat eksplorasi. Start-up ini didedikasikan untuk memberikan AI "kecerdasan ruang" atau "spatial intelligence", atau kemampuan untuk melahirkan, bernalar di dalam, dan berinteraksi dengan, dan bernavigasi dalam, dunia-dunia atau lingkungan alam sekitar 3D. Sistem-sistem AI yang akan dibangun dan dikembangkan oleh World Labs dapat memahami, mengerti, dan dapat menjelajah, ruang-ruang 3 dimensi dengan cara-cara seperti yang dilakukan manusia.
Video di atas adalah suatu pandangan pertama dari sistem AI World Labs yang menghasilkan dunia-dunia 3D dari sebuah image. Apa dan bagaimana bangunan dunia 3D yang dibayangkan World Labs, dapat anda lihat di video pertama ini. Suatu sistem AI dikerahkan untuk menciptakan pemandangan-pemandangan 3D yang interaktif seluruhnya hanya dari satu citra. Bayangkanlah anda meng-upload sebuah gambar, lalu anda dapat masuk ke dalam dunia dalam gambar itu dan bergerak di sekitarnya seperti suatu pemandangan dari video game kesukaan anda. Sumber video: World Labs Demos Its 3D Worlds IEEE Spectrum atau Maginative YouTube.
World Labs akan menciptakan perubahan-perubahan yang bermakna bagi teknologi dan industri lewat penyediaan jalan-jalan baru bagi AI dalam berinteraksi dengan dunia fisik tiga dimensi dan objek-objek di dalamnya. Perusahaan start-up ini menggambarkan dirinya sebagai perusahaan yang membangun "model-model dunia yang besar" atau "large world models (LWMs)" dalam teknologi mutakhir AI.
Karya Li Fei Fei dalam "spatial intelligence" di World Labs dapat memiliki aplikasi-aplikasi yang potensial dan besar dalam beberapa bidang penting, seperti:
• Robotics: AI dengan kecerdasan ruang dapat mengembangkan dan menyempurnakan navigasi robot, pemahaman robotik atas lingkungan fisik 3D, dan mengontrol serta mempengaruhi objek-objek;
• Wahana-wahana otonomus: Kecerdasan ruang memampukan mobil-mobil yang mengemudikan dirinya sendiri ("self-driving cars") untuk memahami dengan lebih baik lingkungan sekitar 3D mereka, mendeteksi hambatan-hambatan, dan bernavigasi dalam lingkungan sekitar yang rumit;
• Realitas virtual dan "augmented reality": Kecerdasan ruang dapat memperluas dan mengembangkan pengalaman-pengalaman masuk jauh ke kedalaman ("immersive") lingkungan virtual, serta memahami dan berinteraksi dengan lebih baik dengan alam virtual;
• Perawatan kesehatan: Diagnosis dan pengobatan yang dibantu AI dapat memanfaatkan kecerdasan ruang di bidang-bidang perencanaan operasi dan analisis pencitraan medis ("medical imaging analysis").
Start-up World Labs di tahun 2024 telah dua ronde menggalang dana, alhasil start-up ini telah menerima uang dari investor-investor top bidang teknologi, termasuk Andreessen Horowitz, dana AI Radical Ventures, selain Marc Benioff, Geoffrey Hinton, Reid Hoffman dan Eric Schmidt. Dalam ronde termutakhir penggalangan dana, telah berhasil dihimpun 100 juta USD. Investor-investor ini menilai bisnis World Labs kini telah mencapai investasi lebih dari 1 milyar USD, hanya dalam 4 bulan.
Li Fei Fei menyadari betul bahwa sejak peluncuran chatbot ChatGPT yang kuat dari platform OpenAI (dengan Sam Altman sebagai co-founder dan CEO) di akhir 2022, yang membawa konsumen-konsumen berhadapan muka langsung dengan kekuasaan yang amat besar di bidang AI modern, dimulailah perlombaan mencapai keunggulan teknologis di antara start-ups dan pemain-pemain Big Tech seperti Microsoft dan Google. Lompatan ke depan dalam kapabilitas yang diperlihatkan oleh ChatGPT juga memperberat ketakutan-ketakutan terhadap bahaya-bahaya AI: disrupsi tenaga kerja, disinformasi dan bahkan risiko eksistensial.
Kata Prof. Li Fei Fei, Ph.D., terkait dengan pengembangan teknologi AI, "Peradaban itu seperti sebuah perahu besar dan kita sedang berlayar ke depan 'in the dark'...." Di manakah mercusuar-mercusuar? Sumber image: Freepik.
Menurut Fei Fei, di akhir 2023, dalam mengejar kemajuan AI, "Peradaban itu seperti sebuah perahu besar dan kita sedang berlayar ke depan dalam kegelapan." Katanya juga, "Sekarang ini dalam bidang AI, apa yang membuat saya khawatir adalah kita tidak memiliki sumber-sumber daya untuk memastikan bahwa AI akademia tetap bertahan sebagai suatu pusat gravitasi. Karena jika kita kehilangan pusat gravitasi, maka pusat gravitasi lainnya didorong oleh kapitalisme."
Dalam situasi semacam itu, Fei Fei melihat HAI yang didirikannya dan lembaga-lembaga publik lainnya sebagai mercusuar-mercusuar yang memberi terang pada jalur pelayaran yang aman. Menelusuri jalur ini telah makin menegangkan, khususnya sejak peluncuran ChatGPT OpenAI.
Dalam konteks yang telah digambarkan oleh Fei Fei di atas, pendirian start-up World Labs di tahun 2024 harus kita tempatkan.
Selanjutnya, perlu diketahui lebih jauh tentang "artificial spatial intelligence" yang digagas dan akan diwujudkan oleh Li Fei Fei dan para penerusnya lewat perusahaan start-up World Labs.
Sebetulnya, kecerdasan manusia itu majemuk, tidak tunggal. Cuma, selama ini yang ditonjolkan hanya kecerdasan matematis dan linguistik, yang peringkatnya diberi angka psikometrik yang disebut "IQ" atau "intelligence quotient", dengan IQ rata-rata 100. Howard Gardner dikenal dengan teorinya tentang kecerdasan majemuk atau "multiple intelligences", dan salah satunya adalah kecerdasan ruang atau "spatial intelligence". Pendekatan MI menolak anggapan adanya "kecerdasan umum" atau "general intelligence" dalam diri setiap orang, sebagai bawaan kelahiran. Menurut Gardner, dan juga beberapa psikolog kognitif dan neurosaintis kognitif, manusia memiliki kecerdasan majemuk yang mencakup:
• Kecerdasan logis matematis
• Kecerdasan linguistik
• Kecerdasan musikal
• Kecerdasan spasial
• Kecerdasan interpersonal
• Kecerdasan intrapersonal
• Kecerdasan kinestetik-ragawi
• Kecerdasan naturalis
• Kecerdasan eksistensial
• Kecerdasan pedagogis
• Kecerdasan emosional
• Kecerdasan seksual
• Kecerdasan digital
Karena kecerdasan manusia itu majemuk, multiple, maka suatu sistem AI humanoid perlu juga memiliki kecerdasan yang majemuk. Sistem ini dapat dinamakan "Artificial Multiple Intelligence" atau AMI.
Li Fei Fei dengan jelas juga menekankan bahwa kecerdasan manusia itu majemuk. Dalam suatu wawancara eksklusif oleh IEEE Spectrum pada tanggal 11 Desember 2024, dia menyatakan hal-hal yang penting. Katanya, "Aku pikir, adalah sesuatu yang intuitif kita ketahui bahwa kecerdasan memiliki level-level kompleksitas dan kecakapan yang berlainan.... Revolusi DL selama berdekade-dekade yang telah lewat, khususnya 10 tahun lebih yang lalu, telah memberi kita pelajaran tentang hal-hal yang harus kita lakukan dengan kecerdasan visual. Hal-hal ini sangat menggembirakan dan memberi harapan. Kita semakin mampu menangani teknologi ini...."
Li melanjutkan, katanya, "Sesegera anda dapat menemukan petunjuk-petunjuk dari lingkungan dunia sekitar lewat persepsi, desakan evolusioner sesungguhnya makin menguat, dan kondisi ini mendorong kecerdasan bergerak maju.... Aku pikir, kita sedang menciptakan kemampuan dan kecakapan lebih banyak lagi. Aku pikir, kemampuan dan kecakapan ini semakin kompleks, semakin cakap. Aku pikir, sangatlah benar bahwa menangani problem kecerdasan ruang adalah suatu langkah yang fundamental dan kritis, menuju kecerdasan sepenuhnya ("full-scale intelligence").
Jika yang dimaksud "kecerdasan sepenuhnya" adalah totalitas kecerdasan majemuk (seperti diteorikan Howard Gardner), maka Artificial Spatial Intelligence juga harus disertai dengan kecerdasan-kecerdasan lain yang komplementer. Mengingat AI dapat menimbulkan masalah-masalah etis yang serius ketika disalahgunakan oleh manusia, maka hal yang mendesak dijalankan adalah memasukkan kecerdasan emosional, kecerdasan interpersonal, kecerdasan sosial, dan kecerdasan eksistensial, ke dalam sistem-sistem AI yang humanoid atau yang "human-centered". Untuk suatu sistem atau model AI dapat memiliki "soft skills" yang fungsional ini, diperlukan waktu yang panjang dan tahap-tahap riset dan pengembangan yang rumit dan lintas ilmu.
Dalam The Stanford Daily, edisi 23 April 2019, Li Fei Fei telah menegaskan bahwa "[Kita perlu] dengan terbuka menerima kajian-kajian AI yang multidisipliner, karena AI itu memerlukan pembenihan silang dengan ilmu ekonomi, dengan etika, dengan hukum, dengan filsafat... Ada jauh lebih banyak lagi hal yang kita perlu pahami mengenai dampak-dampak sosial, insani, antropologis, etis dari AI, dan mungkin kita tidak dapat mengerjakan ini sendirian."
Selanjutnya, dalam wawancara dengan IEEE Spectrum tersebut di atas, Li Fei Fei menyatakan, "Aku pikir kecerdasan ruang adalah arah ke mana kecerdasan visual sedang bergerak. Jika kita serius mau memecahkan problem visi dan juga mau menghubungkan visi dengan tindakan, maka ada suatu fakta yang sangat simpel, fakta yang terang-benderang: Dunia ini 3D. Kita tidak tinggal di suatu dunia yang datar. Agen-agen fisik kita, entah mereka itu robot-robot, atau pun devices, akan berdiam dalam dunia 3D. Bahkan dunia virtual makin menjadi 3D."
Menurut Li Fei Fei, jika kecerdasan spasial berhasil didapat untuk model-model AI, maka kecerdasan jenis ini, lewat model-model dunia yang besar, akan menutup kesenjangan antara melihat dan melakukan, "the gap between seeing and doing". Maksudnya, kecerdasan visual dan persepsi akan disatukan dengan kecerdasan ruang.
Si pewawancara melanjutkan pertanyaannya, "Anggaplah kita dapat membuat sistem-sistem AI sungguh-sungguh memahami dunia 3D, lalu apa yang sistem-sistem ini dapat berikan kepada kita?"
Li Fei Fei menjawab, "Sistem-sistem AI ini akan membuka pintu bagi banyak kreativitas dan produktivitas untuk manusia. Aku akan suka merancang rumahku dengan cara yang jauh lebih efisien. Aku tahu bahwa sangat banyak pemanfaatan medis yang melibatkan pemahaman atas suatu dunia 3D yang sangat khusus, yakni tubuh manusia. Kita selalu berbicara tentang suatu masa depan di mana manusia akan menciptakan robot-robot untuk menolong kita, tapi robot-robot menjelajah dalam suatu dunia 3D, dan mereka memerlukan kecerdasan ruang sebagai bagian dari otak mereka. Kita juga berbicara tentang dunia-dunia virtual yang akan memungkinkan orang untuk mengunjungi tempat-tempat atau belajar konsep-konsep atau mendapatkan hiburan. Dan penggunaan teknologi 3D, khususnya teknologi hibrid, itulah yang kita namakan 'augmented reality' atau AR. Aku akan suka berjalan menelusuri suatu taman nasional dengan memakai sepasang kaca mata yang memberiku informasi tentang pepohonan, jalan setapak, dan awan-awan. Aku juga akan suka belajar kecakapan-kecakapan yang berlainan melalui bantuan kecerdasan ruang."
Tidaklah mudah untuk merancang, menciptakan dan mengembangkan serta melatih suatu model AI yang memiliki kecerdasan spasial, apalagi kecerdasan majemuk yang "full scale". Terkait dengan kecerdasan spasial, ada sekian tantangan dan keterbatasan yang harus ditangani dengan baik, yakni (chat dengan Meta AI, 24 Februari 2025):
• Ketersediaan dan kualitas data: dataset-dataset yang dianotasi dengan baik, beranekaragam, dan berkualitas tinggi, sangatlah esensial dalam melatih model-model AI yang memiliki kecerdasan ruang;
• Kompleksitas komputasional: memproses dan menganalisa data 3D lewat kapasitas komputasional dapat sangat intensif, yang memerlukan sumber-sumber daya yang signifikan dan teknik-teknik optimasi;
• Generalisasi dan adaptasi: model-model AI yang memiliki kecerdasan spasial harus bisa, berdasarkan (sedikit) pembelajaran sebelumnya, menggeneralisasi lingkungan-lingkungan sekitar yang baru dan tak terlihat dan beradaptasi terhadap kondisi-kondisi yang sedang berubah.
Tantangan dan kesulitan juga bertambah jika kita fokus pada komponen-komponen penting dari kecerdasan ruang, yakni:
• Visi komputer: Teknologi visi komputer memampukan AI untuk menafsir dan memahami data visual dari citra-citra dan video-video, termasuk rekonstruksi suatu objek 3D, dan pengenalan objek;
• Simulasi dan pemodelan 3D: Memungkinkan AI untuk menciptakan dan mempengaruhi atau memanipulasi model-model 3D, mensimulasi interaksi-interaksi fisik dan memprediksi hal-hal yang akan dihasilkan;
• Penalaran geometrik: Memungkinkan AI untuk memahami hubungan-hubungan, bentuk-bentuk dan struktur-struktur spasial sehingga mempermudah dan membantu tugas-tugas seperti bernavigasi dan menghindari hambatan-hambatan;
• Integrasi sensorimotor: Menggabung data sensori indrawi (misalnya visi, sensor-sensor, dan lidar atau radar berpulsa sinar laser) dengan kontrol-kontrol motor untuk memampukan AI berinteraksi dan mempengaruhi objek-objek dalam ruang 3D.
Baiklah ucapan Li Fei Fei berikut ini kita pikirkan. Katanya, "Math is pretty clean. Humans are messy." Matematika itu sangat bersih. Manusia tidak bersih, tidak apik, berantakan.
Dengan ucapannya itu, Fei Fei bermaksud mengungkapkan dua hal. Pertama, matematika itu persis dan teratur: matematika beroperasi menurut aturan-aturan dan prinsip-prinsip yang ketat, dan ini membuatnya suatu kawasan yang bersih dan dapat diprediksi. Kedua, perilaku dan emosi-emosi manusia kompleks dan tidak terprediksi; manusia, sebaliknya, tidak apik, berantakan, tidak bersih. Maksudnya, perilaku manusia, emosi-emosi mereka, dan proses-proses pengambilan keputusan mereka, ruwet, bernuansa, dan kerap tidak terprediksi. Fei Fei boleh jadi sedang menyoroti kesulitan-kesulitan dalam membuat model perilaku manusia, emosi-emosi mereka, dan proses-proses pengambilan keputusan mereka, dengan memakai metode-metode matematis dan komputasional, yang pada hakikatnya bersih dan persis.
Jika demikian maksudnya, apakah itu berarti Fei Fei perlu meninggalkan manusia, dan berkonsentrasi saja pada tugasnya sebagai seorang saintis AI? Fei Fei tidak mengambil jalan ini; dia memilih keduanya, menjadi seorang saintis AI sekaligus seorang humanis. Baginya, teknologi AI yang terus-menerus dikembangkan haruslah berpusat pada manusia, "human centered".
Tertinggallah sebuah pertanyaan, jika kodrat manusia memang berantakan, tidak bersih, tidak apik, mengapa para saintis dan teknolog AI perlu menciptakan model-model AI yang humanoid, yang "menyerupai manusia", yang dinamakan Artificial General Intelligence (AGI)? Bukankah ciptaan mencerminkan identitas sang pencipta?
Sistem-sistem AI sebagai ciptaan manusia dapat, pada esensinya, mencerminkan bias-bias, cacat-cacat, kompleksitas, dan keadaan yang tidak terprediksi, yang menjadi bagian dari kodrat manusia. Karena itu, memastikan bahwa sistem-sistem AI humanoid (atau AGI) segaris dengan nilai-nilai dan etika insani, dapat menjadi suatu tantangan yang signifikan.
Ketika hal-hal yang dapat mengkhawatirkan ini dipertimbangkan, maka sejumlah pakar AI mendukung dan menganjurkan pendekatan-pendekatan alternatif bagi pengembangan AI. Setidaknya, ada dua pendekatan alternatif:
• Non-Humanoid AI: Pengembangan sistem-sistem AI harus fokus pada desain-desain AI yang non-humanoid, yang tidak bertujuan untuk meniru atau mereplikasi perilaku manusia, melainkan untuk mengoptimasi tugas-tugas dan fungsi-fungsi yang spesifik;
• Value-centric AI: Pendekatan AI yang berpusat pada nilai-nilai memprioritaskan nilai-nilai dan etika insani, dan bukan cuma mereplikasi perilaku manusia.
Dalam Observer edisi 5 November 2024, Li Fei Fei sendiri menyatakan bahwa "Sejujurnya aku bahkan tidak tahu apa maksud dari AGI... orang menegaskan 'Engkau akan tahu ketika engkau melihatnya'. Aku tebak, aku belum melihatnya." Fei Fei melanjutkan, "Yang benar adalah aku tidak punya banyak waktu untuk memikirkan makna kata-kata AGI, karena pikirku ada banyak hal yang penting untuk dikerjakan, dalam pendidikan, dalam memajukan lembaga HAI, dalam perluasan jangkauan beranekaragam stakeholder, dan dalam membangun kerjasama dengan rekan-rekan sejawat dan mahasiswa-mahasiswaku."
Sementara ada banyak hal yang telah dikatakan orang tentang bahaya-bahaya eksistensial yang akan dapat timbul dari teknologi baru AI, Fei Fei lebih fokus pada ihwal bagaimana dampak-dampak AI akan dialami dalam kehidupan sehari-hari. Katanya, "Aku pikir sangatlah penting kalau kita menjauh dari spekulasi-spekulasi fiksi sains dan hiperbola yang menimbulkan ketakutan-ketakutan publik, lalu sungguh-sungguh mendatangkan terang yang lebih kuat untuk menyoroti masalah-masalah nyata yang sedang memberi dampak pada manusia-manusia yang real."
Pada bagian penutup otobiografinya, The Worlds I See, Fei Fei mengungkapkan keterpanaan dan kekagumannya pada kemampuan kita, manusia, untuk menciptakan suatu teknologi AI yang serupa dengan suatu forsa alam, "sesuatu yang begitu besar, begitu berkuasa, dan begitu mudah berubah, sehingga teknologi ini dapat mudah membinasakan, sama mudahnya dengan memberi inspirasi." Namun, teknologi ini memerlukan jauh lebih banyak lagi, ketimbang hanya klise-klise yang samar, untuk membuat AI layak kita percayai.
Akhir kata, apa perasaan Prof. Li Fei Fei, Ph.D., sebagai seorang saintis AI yang terkenal dan dikitari banyak sahabat, rekan sejawat dan murid-murid? Dia menyatakan bahwa "Anda harus merasa sepi sendirian untuk menjadi seorang saintis yang baik, karena sains sebagai suatu profesi harus berani berhadapan dengan 'hal-hal yang tidak diketahui', 'the unknown'. Anda harus kesepian. Anda harus gentar. Anda harus melihat tidak ada seorang lain pun di sekeliling anda.... Dan anda dapat salah, tapi setidaknya anda memilih kesempatan untuk bertarung dalam usaha menemukan sesuatu yang besar."
Thank you, Prof. Li Fei Fei, Ph.D., for your incredibly fascinating contributions to AI fields.
Stay eirenic.
ioanes rakhmat
* Editing mutakhir 10 Maret 2025
References
Tabby Kinder, George Hammond, and Eleanor Olcott, "The 'Godmother of AI' Fei-Fei Li builds $1bn start-up in 4 months", Financial Times, 17 Juli 2024, https://www.ft.com/content/0b210299-4659-4055-8d81-5a493e85432f.
Zoey Zhang, "'Godmother of AI' shy Chinese-American pioneer Fei-Fei Li seeks science chance for all", South China Morning Post, 5 August 2024, https://www.scmp.com/news/people-culture/article/3272931/godmother-ai-shy-chinese-american-pioneer-fei-fei-li-seeks-science-chance-all.
Thomas Babychan, "Why is Fei-Fei Li known as Godmother of AI?", Techstory, 19 July 2024, https://techstory.in/why-is-fei-fei-li-known-as-godmother-of-ai/.
Eliza Strickland, "AI Godmother Fei-Fei Li Has a Vision for Computer Vision" (An interview), IEEE Spectrum, 12 December 2024, https://spectrum.ieee.org/fei-fei-li-world-labs.
Harini Sreepathi (Adm.), "Fei-Fei Li, Bio", Stanford|Profiles, https://profiles.stanford.edu/fei-fei-li;jsessionid=0826206B8EBAFB18CDB3C1302EC54DE6.cap-su-capappprd98.
Ioanes Rakhmat, "Teori 'Multiple Intelligences' Howard Gardner", Freidenk Blog, 20 Oktober 2014, https://ioanesrakhmat.blogspot.com/2014/10/teori-multiple-intelligences-howard.html?m=0.
George Hammond, "AI scientist Fei-Fei Li: 'Math is pretty clean. Humans are messy'", Financial Times, 15 Dec 2023, https://www.ft.com/content/d5f91c27-3be8-454a-bea5-bb8ff2a85488.
Shan Reddy, "Fei-Fei Li and Yuval Noah Harari discuss humanizing artificial intelligence, prospects for democracy", The Stanford Daily, 23 April 2019, https://stanforddaily.com/2019/04/23/fei-fei-li-and-yuval-noah-harari-discuss-humanizing-artificial-intelligence-prospects-for-democracy/.
Fei-Fei Li, "Fei-Fei Li says understanding how the world works is the next step for AI", Economist, 20 November 2024, https://www.economist.com/the-world-ahead/2024/11/20/fei-fei-li-says-understanding-how-the-world-works-is-the-next-step-for-ai.
Fei-Fei Li, The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI (U.K.: Flatiron Books, December 2023).
Alexandra Tremayne-Pengelly, "'Godmother of A.I.' Fei-Fei Li Has No Idea What A.G.I. Means", Observer, 5 November 2024, https://observer.com/2024/11/fei-fei-li-godmother-ai-agi/.
Kinling Lo, "Ex-Google AI chief Fei-Fei Li among Chinese honoured by US Academy of Medicine", South China Morning Post, 21 October 2020, https://www.scmp.com/news/china/diplomacy/article/3106460/ex-google-ai-chief-fei-fei-li-among-chinese-honoured-us.
Tristan Greene (ed.), "AI guru Fei Fei Li set to leave Google this year", TNW Newsletter, 10 September 2018, https://thenextweb.com/news/ai-guru-fei-fei-li-set-to-leave-google-this-year.
Tom Simonite (ed.), "Fei-Fei Li Wants AI to Care More About Humans", Wired, 28 March 2019, https://www.wired.com/story/fei-fei-li-ai-care-more-about-humans/.
John Thornhill, "The Worlds I See --- keeping the human at the heart of AI", Financial Times, 2 November 2023, https://www.ft.com/content/de3f4813-4f36-40c7-9d50-980144674d87.