Kembali ke Lab
RAG Natural Language Processing

Eksperimen RAG untuk Dokumen Internal

Eksperimen pipeline Retrieval-Augmented Generation untuk membaca, memecah, mencari, dan menjawab pertanyaan dari dokumen PDF atau knowledge base internal.

Apa yang diuji

Eksperimen ini menguji bagaimana dokumen internal dapat diubah menjadi knowledge base yang bisa dicari dan digunakan oleh AI. Fokusnya ada pada proses ingestion dokumen, chunking, pencarian konteks, dan kualitas jawaban yang dihasilkan dari sumber data yang tersedia.

Langkah eksperimen

  1. Mengambil dokumen PDF atau teks sebagai sumber knowledge base.
  2. Memecah isi dokumen menjadi chunk yang lebih kecil agar lebih mudah dicari oleh sistem retrieval.
  3. Membuat embedding dari setiap chunk dokumen untuk mendukung pencarian berbasis kemiripan konteks.
  4. Menyimpan hasil embedding ke vector search agar query pengguna dapat menemukan konteks yang relevan.
  5. Menguji beberapa pertanyaan untuk melihat apakah jawaban AI tetap sesuai dengan isi dokumen.

Hasil yang ingin dipahami

  • Mengetahui seberapa baik dokumen PDF dapat dipecah menjadi konteks yang mudah dicari dan tetap mempertahankan makna aslinya.
  • Menguji relevansi jawaban AI berdasarkan hasil retrieval dari dokumen internal, bukan hanya dari pengetahuan umum model.
  • Menentukan pola chunking, embedding, dan query yang paling cocok untuk kebutuhan knowledge base.
  • Memahami batasan RAG, seperti jawaban yang kurang lengkap ketika dokumen tidak memiliki konteks yang cukup atau struktur dokumen kurang rapi.