![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi6PEpRe-fhsvqt-cbKaecaCLUVnP7WvY1teVh1Cb92fA33iAZYTrjZ8U8eqZ6FEe2ztDGvhkT28z-OOhBNVVllQ95R25f_CqrY2engFkYdHStflFA5hz_n3n56EwHJJBhYqc-XyYnJS-2m5L3O61gcCKQCKpy8OxBr0RD3Rmo-dkJEPFqiB5hC2WXT/w640-h312/Screenshot%202022-12-08%20at%2022-30-28%20Google%20Colaboratory.png)
หลังจากที่ผมส่งภาษาไทยแบบ blank (ไม่มี model อะไร) เข้าไป spaCy เมื่อ 5 ปีก่อน แต่การใช้งานไม่สามารถใช้งานได้แบบ spacy.load(___) กับภาษาไทยได้ เพราะยังไม่มีโมเดลให้รัน
มาวันนี้ผมได้พอร์ตส่วน word2vec จากโมเดล thai2fit (หรือ thai2vec) ของ Charin Polpanumas ในตำนาน ให้ใช้งานกับ spaCy ผ่าน spacy.load ได้สำเร็จ (เพิ่งทำได้เมื่อ 1 ชั่วโมงก่อนของเวลาโพสต์) จึงทำให้ตอนนี้รองรับเฉพาะส่วน token2vec เท่านั้น และโมเดลอื่น ๆ ที่จะตามมาในอนาคต
การใช้งาน ตอนนี้ต้องโหลดโมเดลมาก่อน ในอนาคตผมจะส่งโมเดลเข้าต้นน้ำ spaCy ต่อไป เพื่อให้สามารถใช้งานได้เพียงแค่ spacy.load("th") เหมือนภาษาอังกฤษ (ถ้ามีเวลาว่าง)
สามารถลองเล่นผ่าน Colab ได้ลิงก์นี้ https://colab.research.google.com/drive/1b_gZ34zZHVFeMBlz16F2cmjE7vKGqbGW?usp=sharing
GitHub: https://github.com/PyThaiNLP/thai_spacy_model
ช่วงโฆษณา ส่ง GitHub sponsors ได้ที่ https://github.com/sponsors/wannaphong/ ครับ 🙏
ความคิดเห็น
แสดงความคิดเห็น