หลายสถาบันสนใจโปรแกรมตรวจสอบการคัดลอกทางวรรณกรรม หรือ Plagiarism Software กันมาก บางสถาบันก็ซื้อไปแล้วและก็พบปัญหาหลากหลายที่วันนี้ยังแก้ไขไม่สำเร็จทั้งด้านเทคนิค และการส่งเสริมการใช้งาน (การบริหารจัดการ) เฉพาะเนื้อหานี้ขอเน้นในประเด็น เอกสารต้นแหล่งฟอร์แมต PDF ที่เป็นภาษาไทย เพราะพบว่าหลายสถาบันเลือกนำเข้าเอกสาร PDF เข้าไปเป็นต้นแหล่งเพื่อใช้ในการตรวจสอบ และเอกสาร PDF จำนวนมากไม่รองรับกับโปรแกรมดังนี้ เพราะ

1) เอกสาร PDF ดังกล่าวใช้วิธีการ Scan ซึ่งซอฟต์แวร์ตรวจสอบฯ ที่เลือกใช้ไม่มีฟังก์ชัน OCR หรือมีแต่ยัง OCR ภาษาไทยได้ไม่สมบูรณ์ ไม่รวมวิธีการสแกนเอกสาร PDF ไม่เหมาะสม เช่น ใช้ค่าความละเอียด (Resolution) เพียง 72dpi

2) เอกสาร PDF ดังกล่าวใช้วิธีการแปลง (convert) ต้นฉบับงานพิมพ์ เช่น MS Word format เป็น PDF ซึ่งก็พบว่าเอกสาร PDF จำนวนมากเมื่อแปลงกลับเป็นข้อความ (Text) ก็จะได้ข้อความภาษาไทยที่ไม่สมบูรณ์ หรืออาจจะเป็นข้อความขยะ  ดังภาพตัวอย่าง

เอกสารภาษาไทยต้นฉบับ PDF
เอกสารภาษาไทยต้นฉบับ PDF

เมื่อนำเอกสาร PDF ภาษาไทยต้นฉบับดังภาพข้างต้น มาแปลงกลับเป็นเอกสารข้อความ จะพบว่ามีปัญหาในส่วนสระ และวรรณยุกต์ ดังภาพ

เอกสารข้อความจาก PDF
เอกสารข้อความจาก PDF

ดังนั้น ก่อนเลือกซื้อโปรแกรมตรวจสอบการคัดลอกทางวรรณกรรม ควรให้ความสำคัญประเด็นเอกสารต้นแหล่งภาษาไทย และการแปลงกลับเป็นภาษาไทยที่ถูกต้องก่อนนะครับ โดยขอให้ผู้แทนจำหน่ายทดสอบและให้คำมั่นสัญญาว่าจะแก้ไขให้ทันทีเมื่อพบปัญหาดังกล่าว

biotec

mtec

nectec
nanotec
entec

tsp

AIMI

nctc

ตราโลโก้ ศูนย์เทคโนโลยีเพื่อความมั่นคงของประเทศและการประยุกต์เชิงพาณิชย์ (Logo of National Security and Dual-Use Technology Center: NSD)

ตราโลโก้ ศูนย์ทดสอบทางพิษวิทยาและชีววิทยา (Toxicology and Bio Evaluation Service Center)

 
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.)
เป็นหน่วยงานของรัฐที่จัดตั้งขึ้นเพื่อศึกษาวิจัยและพัฒนาทางด้านวิทยาศาสตร์ และเทคโนโลยีเพื่อการพัฒนาประเทศไทย ไม่ได้มีวัตถุประสงค์เพื่อแสวงหากำไร
หากท่านพบว่ามีข้อมูลใดๆ ที่ละเมิดทรัพย์สินทางปัญญาปรากฏอยู่ในเว็บไซต์ของสำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
โปรดแจ้งให้ทราบเพื่อดำเนินการแก้ปัญหาดังกล่าวโดยเร็วที่สุดต่อไป