ข้ามไปที่เนื้อหาหลัก

เล่าประสบการณ์ร่วมพัฒนาโปรเจค open source ของ Google บน GitHub

เมื่อไม่กี่เดือนก่อน ผมได้มีโอกาสใช้ pygtrie (https://github.com/google/pygtrie) ซึ่งเป็นโมดูลสำหรับโครงสร้างข้อมูล trie ใน Python ของ Google แต่ผมกลับติดตั้งมันลงใน Windows 10 ไม่ได้ เนื่องจากปัญหา UnicodeDecodeError ของ setup.py ที่เกิดจากการอ่านไฟล์ภายนอก -_- (เป็นปัญหาคลาสิคของ Python เนื่องจากเครื่องผมตั้งเป็นภาษาไทย) ผมจึงตั้ง https://github.com/google/pygtrie/issues/16 แล้วทำการ fork ไปแก้ Bug แล้วส่ง Pull requests กลับมาให้กูเกิล
เจอ Googlebot ทักทายทันที มันให้ทำการ sign กับ Google ก่อน ไม่เข้า sign มันจะไม่รับ Pull requests ผมจึงเข้าไป sign กับ Google ที่ https://cla.developers.google.com/clas เสร็จแล้วพิมพ์ I signed CLA. จากนั้น Googlebot ก็ทักทายตอบกลับ :)
ไม่ถึง 2 วัน กูเกิลก็รับ Pull requests ผมเข้าไปยัง pygtrie แล้ว :)
การ sign กับ Google ใช้เวลารวดเร็วมาก และไม่ซับซ้อน เป็นประสบการณ์ดี ๆ ที่เคยได้ร่วมเป็น contributors กับโปรเจค open source ของ Google บน GitHub
ถ้าคุณเจอ Bug กับโปรเจคโครงการอะไรบน GitHub แล้วคุณแก้ได้ ขอให้คุณทำการ fork แล้วส่ง Pull requests กลับมาเลย !!!

ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

ฝึกงาน IST @ VISTEC : วันที่ 0 เข้าหอพัก

สวัสดีครับ ช่วงปิดเทอมของปี 2 ผมได้โอกาสไปฝึกงานกับ IST ที่ VISTEC ในโครงการ "IST Research Internship 2019"

จะว่าไปไม่ได้เขียน blog นานเลย

ปีก่อนแทบไม่ได้เขียน blog ใหม่ ๆ หรือบทความใหม่ ๆ ลงบล็อกนี้กับเว็บอื่น ๆ เลย มีแต่เขียนข่าวสั้น ๆ ลง blognon กับบทความรีวิวบ้างแค่นั้น หวังว่าปีนี้คงมีเวลาเขียนมากขึ้นมั้ย

spaCy ภาษาไทยมาแล้ว!!!

หลังจากที่ผมส่งภาษาไทยแบบ blank (ไม่มี model อะไร) เข้าไป spaCy เมื่อ 5 ปีก่อน แต่การใช้งานไม่สามารถใช้งานได้แบบ spacy.load(___) กับภาษาไทยได้ เพราะยังไม่มีโมเดลให้รัน มาวันนี้ผมได้พอร์ตส่วน word2vec จากโมเดล thai2fit (หรือ thai2vec) ของ Charin Polpanumas ในตำนาน ให้ใช้งานกับ spaCy ผ่าน spacy.load ได้สำเร็จ (เพิ่งทำได้เมื่อ 1 ชั่วโมงก่อนของเวลาโพสต์) จึงทำให้ตอนนี้รองรับเฉพาะส่วน token2vec เท่านั้น และโมเดลอื่น ๆ ที่จะตามมาในอนาคต การใช้งาน ตอนนี้ต้องโหลดโมเดลมาก่อน ในอนาคตผมจะส่งโมเดลเข้าต้นน้ำ spaCy ต่อไป เพื่อให้สามารถใช้งานได้เพียงแค่ spacy.load("th") เหมือนภาษาอังกฤษ (ถ้ามีเวลาว่าง) สามารถลองเล่นผ่าน Colab ได้ลิงก์นี้ https://colab.research.google.com/drive/1b_gZ34zZHVFeMBlz16F2cmjE7vKGqbGW?usp=sharing GitHub: https://github.com/PyThaiNLP/thai_spacy_model   ช่วงโฆษณา ส่ง GitHub sponsors ได้ที่ https://github.com/sponsors/wannaphong/ ครับ 🙏