Badan Riset dan Inovasi Nasional (BRIN) sedang melakukan penelitian untuk mengembangkan model Named Entity Recognition (NER) dengan pendekatan multi source. Penelitian ini bertujuan untuk mendukung pekerjaan di bidang kesehatan seperti farmasi, kedokteran, biologi, dan ilmu kesehatan lainnya.
Menurut Peneliti Ahli Madya Pusat Riset Sains Data dan Informasi BRIN, Slamet Riyanto, riset tentang model NER dengan pendekatan multi source didasari oleh studi literatur yang dilakukan melalui dokumen ilmiah tidak terstruktur seperti artikel jurnal, laporan, abstrak, dan review. Ia menjelaskan bahwa metode otomatis dan komputasi diperlukan untuk mengekstrak informasi penting dari data tidak terstruktur.
Informasi dari berbagai data tidak terstruktur telah diekstraksi menggunakan Information Extraction (IE), di mana NER merupakan salah satu subtugas IE yang mengenali entitas tertentu dalam teks. NER dalam bidang biomedis bertujuan untuk mengenali dan mengkarakterisasi entitas khusus seperti chemical, drug, disease, protein, DNA, RNA, dan gen.
Slamet menyatakan bahwa NER memiliki potensi untuk memberikan wawasan berharga dari teks domain khusus, seperti menganalisis relevansi statistik entitas tertentu seperti disease. Namun, belum ada model yang bisa secara akurat mendeteksi entitas plant dan disease dalam sebuah dokumen.
Untuk mengatasi hal ini, riset BRIN mengembangkan model NER menggunakan pendekatan multi-source transfer learning. Model yang dihasilkan disebut Plant-Disease Named Entity Recognition (PDNER) yang dilatih menggunakan data dari berbagai sumber dalam domain biomedis dan botani. Diharapkan model PDNER bisa mengenali entitas tanaman dan penyakit dalam dokumen dengan akurasi tinggi.
Penelitian ini diharapkan dapat membantu pendekatan studi literatur dalam mendeteksi entitas tumbuhan dan penyakit secara otomatis dan komputasi. Pendekatan multi source transfer learning juga dianggap dapat mengatasi keterbatasan data berlabel pada domain target.
Selain itu, Guru Besar Divisi Teknik Sistem dan Industri, Departemen Teknik Industri Pertanian IPB, Taufiq Djatna, turut berpartisipasi dalam Webinar Edisi Ke-dua Pusat Riset Sains Data dan Informasi dengan topik “Peran Sains Data dalam Optimisasi Aktivitas Pertanian” dengan menyampaikan materi tentang The Future of Blockchain in Agriculture.