Phân tích toàn diện bộ dữ liệu Fact-checking & Suy luận ngôn ngữ tự nhiên đối kháng tiếng Việt
🏆 Bộ dữ liệu thử thách khó nhất cho NLI tiếng Việt • 🎯 SOTA chỉ đạt 58% accuracy
Xây dựng bộ dữ liệu đối kháng tiếng Việt cho fact-checking, tạo ra các claim phức tạp để thử thách khả năng của mô hình AI.
Sử dụng 3 rounds với mô hình ngày càng mạnh (mBERT → PhoBERT → XLM-R) để tạo dữ liệu có độ khó tăng dần.
Tạo thành công 21,262 mẫu dữ liệu đối kháng chất lượng cao với Fleiss' Kappa > 0.80 (đồng thuận xuất sắc).
Dataset | Mô tả | Số mẫu | Loại dữ liệu | Độ dài text | Phương pháp | SOTA Accuracy |
---|---|---|---|---|---|---|
ViAdverNLI (R1-R3) Adversarial 3 rounds | benchmark NLI adversarial | ~21.3k cặp | premise/hypothesis | premise ~24 từ, hyp ~12-15 từ | human+model loop | ~58% (SOTA) |
ViNLI Baseline NLI | NLI corpus đầu tiên | >30k cặp | premise/hypothesis | premise ~24.5 từ, hyp ~18.1 từ | manual 5 annotator | ~79% (SOTA) |
ViWikiFC Wikipedia source | Wikipedia-based fact-checking | >20k cặp | claim + evidence | claim ~15-20 từ, evidence ~20-40 từ | manual FEVER style | ~79% (SOTA) |
ViFactCheck News articles | news fact-check benchmark | 7,232 cặp | claim + evidence | claim ~12-15 từ, evidence ~30-50 từ | manual expert | ~62% (SOTA) |
ISE-DSC01 Largest dataset | competition dataset | ~49.7k cặp | claim + context | claim ~10-20 từ, context ~50-100 từ | auto+manual | ~84% (SOTA) |
Mô hình SOTA chỉ đạt ~58% accuracy, thấp hơn đáng kể so với các dataset khác (~79–84%)
Duy nhất sử dụng human-and-model-in-the-loop để thu thập mẫu gây bẫy cho mô hình
Tỷ lệ trùng từ thấp, nhiều cách diễn đạt khác biệt, bao gồm ẩn dụ, thay đổi chi tiết nhỏ
Khi huấn luyện trên ViAdverNLI, mô hình cải thiện hiệu quả tổng quát trên các dataset NLI khác
Cung cấp benchmark NLI adversarial cho tiếng Việt, mở hướng nghiên cứu robust NLI và fact-checking
Dữ liệu huấn luyện:
ViNLI + ViWikiFC
Số mẫu: 5,347
Kappa: 0.8097
Dữ liệu huấn luyện:
ViNLI + ViWikiFC + ViFactCheck + ViA1
Số mẫu: 5,961
Kappa: 0.8099
Dữ liệu huấn luyện:
ViNLI + ViWikiFC + ViFactCheck + ViA1 + ViA2 + ISE-DSC01
Số mẫu: 9,954
Kappa: 0.8099