ข้ามไปที่เนื้อหาหลัก

PyThaiNLP ยอดโหลดทั้งหมดกว่า 1 ล้าน 8 แปด

PyThaiNLP ปัจจุบันมียอดโหลดจำนวน 1 แสนดาวน์โหลดต่อเดือน และจำนวนยอดโหลดทั้งหมดกว่า 1 ล้าน 8 แปด กว่า ๆ ถือเป็นยอดที่ค่อนข้างสูงสำหรับซอฟต์แวร์ open source เฉพาะทาง โดยเฉพาะการประมวลผลภาษาไทย
.
ด้วยยอดที่สูงขึ้นจากเมื่อ 2 - 3 ปีก่อน ทำให้เราต้องปรับปรุง PyThaiNLP ให้ดียิ่งขึ้น ทั้งเรื่องปรับปรุงโค้ด ปรับปรุงโมเดล พัฒนาเทคนิคการเรียกใช้งานให้มีประสิทธิภาพ รวมถึงยังสามารถใช้งานได้ง่าย ติดตั้งได้ง่ายอยู่ เพื่อให้นักเรียน นักศึกษา บุคคลทั่วไปที่เพิ่งเข้ามาในด้านนี้สามารถใช้งานได้สะดวก
.
เรื่องโมเดล เราได้ปรับนโยบายการนำชุดข้อมูล/โมเดลมาใช้งานกับ PyThaiNLP โดยชุดข้อมูล/โมเดลต้องมาจากแหล่งที่เป็นมิตรกับ open source ทั้งเรื่องแหล่งให้โหลดกับใบอนุญาตของชุดข้อมูล/โมเดลนั้น ๆ ทำให้ PyThaiNLP รุ่นถัดไป ทุกชุดข้อมูล/โมเดลจะเป็นมิตรกับ open source ทั้งหมด ทุกคนสามารถใช้งานได้ทุกวัตถุประสงค์
.
ส่วนเรื่องโค้ด เราได้ปรับปรุงการตัดคำ newmm ความท้าทายในการปรับปรุงครั้งนี้คือกฎของ TCC ที่มีตัวอย่างในตัว paper จำนวนน้อย ทำให้เราต้องปรับปรุงโดยอ้างอิงตัวอย่างจาก paper อื่น ๆ ที่ใช้งาน TCC และปรับโค้ดให้ตรงกับ paper มากที่สุด ทำให้ตอนนี้ PyThaiNLP รุ่นถัดไปจะมี TCC อยู่ 2 ตัวด้วยกัน 1) ใกล้เคียงกับ paper 2) สำหรับใช้ในการตัดคำด้วย newmm โดยเราได้แก้เรื่องตัดการันต์ผิดพลาดในกรณี OOV เรียบร้อย และได้ปรับปรุงการโหลดโค้ดภายใน ลดจำนวน import ถ้าต้องการใช้งานเพียงตัดคำ
.
ส่วนเรื่องความโปร่งใส เราพยายามประกาศแผนการพัฒนา PyThaiNLP อยู่ใน issues ของโปรเจคที่อยู่ใน GitHub PyThaiNLP ทุกอัน และนอกจากนั้น เรายังมี model card ของโมเดลที่ใช้งานใน PyThaiNLP อีกด้วย และโมเดลส่วนใหญ่ใน PyThaiNLP สามารถ retrain หรือตรวจสอบได้
.
สุดท้ายนี้ ขอบคุณที่ใช้งาน PyThaiNLP เราจะพัฒนาปรับปรุงซอฟต์แวร์ open source ด้านการประมวลผลภาษาไทยต่อไป
.
ยอดโหลดจาก https://pepy.tech/project/pythainlp

ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

บรรณานุกรมกับ Zotero เรื่องน่าปวดหัวของนศ.มข.

เอาล่ะ ก่อนอื่นเรามาเริ่มที่บรรณานุกรม คืออะไร แบบย่อ ๆ บรรณานุกรมเป็นการอ้างอิงเอกสารหรือเอกสารอ่านเพิ่มเติมที่เรานำมาจัดทำรายงาน หนังสือ รวมไปถึงวิทยานิพนธ์ด้วย เป็นการอ้างอิงกันทางวิชาการถือเป็นเรื่องจำเป็นต้องทำและต้องมี ด้วยเหตุผลหลาย ๆ อย่าง

ฝึกงาน IST @ VISTEC : วันที่ 0 เข้าหอพัก

สวัสดีครับ ช่วงปิดเทอมของปี 2 ผมได้โอกาสไปฝึกงานกับ IST ที่ VISTEC ในโครงการ "IST Research Internship 2019"

เชื่อมต่อ kku-wifi-s ใน Linux (ใช้งานได้กับ Raspberry Pi)

สวัสดีครับ ผมได้ใช้ Raspberry Pi แต่ผมติดปัญหาที่ไม่สามารถเชื่อมต่อ kku-wifi-s  ได้ เนื่องจากการตั้งค่าที่เป็นปัญหา ทำให้ผมหาวิธีจนสามารถเชื่อมต่อ kku-wifi-s ได้ โดยทำตามวิธีดังนี้ครับ