MS MARCO, jika mendengar namanya mungkin terdengar seperti nama kapal pesiar. Mungkin terdengar mirip dengan nama MS Marco Polo, kapal pesiar yang dimiliki oleh Global Maritime Group.
Tetapi cerita kali ini bukan mengenai jalan-jalan menggunakan kapal pesiar, tetapi mengenai satu database baru yang berukuran masif yang baru saja dirilis oleh Microsoft. MS MARCO, merupakan singkatan dari Microsoft MAchine Reading COmprehension.
MS MARCO merupakan database berukuran masif yang berisi lebih dari 100.000 pertanyaan dan jawaban, yang dirilis dengan tujuan mampu menghadirkan cara baru bagi peneliti artificial intelligence atau kecerdasaan buatan untuk mengembangkan metode bagi mesin untuk “membaca dan menjawab pertanyaan seperti manusia.”
Database ini berdasarkan data anonim dari dunia nyata, Microsoft mengatakan bahwa diharapkan peneliti akan mendorong bidang dari machine learning, mirip dengan kemajuan yang terjadi pada pengenal gambar dan percakapan. Database ini bisa digunakan secara gratis, dan bisa diakses dari situs resminya.
“Untuk bergerak ke arah teknologi kecerdasaan buatan umum, kita harus mengambil langkah agar mampu membaca dokumen dan memahaminya seperti seorang manusia,” ungkap Rangat Majumder, Program Manager dari divisi Microsoft Bing Search Engine.
Beberapa pertanyaan dan jawaban mencakup: “Dalam jenis sirkulasi apa yang aliran darah antara jantung dan sel-sel tubuh mengandung oksigen?” (Jawabannya sistemik). Dan “Apakah saya memenuhi syarat OSAP (Ontario Student Assistance Program) jika saya baru tinggal di Kanada?” (Jawaban: Kamu harus menjadi warna negara Kanada, atau penduduk tetap).
Pemahaman bacaan dan menjawab pertanyaan pada dunia nyata menjadi hal yang sangat menantang yang melibatkan penggabungan dari beberapa tugas yang sulit seperti membaca, mengolah, memahami, menalar dan akhirnya meringkas jawaban. Saat ini sistem yang mampu menjawab pertanyaan-pertanyaan yang sulit masih dalam tahap awal.
Mesin pencari atau search engine seperti Bing dan virtual assistant seperti Cortana dan Siri dapat menjawab pertanyaan dasar, seperti misalnya “Tanggal berapa hari kemerdekaan Indonesia?,” atau “Berapa 2.000 x 478?” Tetapi pada banyak kasus, bukannya menjawab langsung search engine dan virtual assistant akan menunjukan si penanya hasil dari pencarian. Pengguna memang bisa mendapatkan informasi yang mereka butuhkan, namun hal tersebut tidaklah efisien, karena penanya harus membuka terlebih dahulu link dari hasil pencarian dan menemukannya jawabannya pada halaman website tertentu.
“Mengingat banyak pengetahuan di dunia ini ditemukan dalam format tulisan, jika kita bisa mendapatkan mesin yang mampu membaca dan memahami dokumen seperti manusia, maka kita dapat membuka semua segalanya dengan skenario yang berbeda.” Ungkat Majumder.
Untuk membuat sistem pertanyaan dan jawaban otomatis yang lebih baik, para peneliti membutuhkan sumber kuat dari apa yang disebut dengan training data. Harapannya adalah bahwa database seperti MS MARCO, dapat digunakan untuk mengajari sistem artificial intelligencies untuk mengenali pertanyaan dan membuat jawabannya, dan akhirnya bisa untuk membuat sistem yang dapat menjawab pertanyaan dengan jawabannya sendiri dari pertanyaan yang unik yang belum pernah ditanyakan sebelumnya.
Jakartawebhosting.com menyediakan layanan Windows Hosting, dengan kecepatan dan stabilitas pusat data dan server yang baik, up time server 99,9%, team support yang siap membantu 24 jam dan biaya langganan yang menarik.