การสืบค้นภาพโดยอาศัยความหมายของสีในภาษาไทย

ระพีพรรณ พิริยะกุล

Abstract


           การศึกษานี้มีวัตถุประสงค์เพื่อหาความสัมพันธ์ระหว่างมูลค่าของสีของภาพในการรับรู้ของคอมพิวเตอร์กับ การรับรู้ของมนุษย์ในภาษาไทย ทั้งนี้เพื่อจะได้นำผลการศึกษาไปพัฒนาสู่การสืบค้นรูปภาพ รวมทั้งการสร้างระบบ กำกับชื่อของสีให้กับภาพแบบอัตโนมัติโดยใช้ภาษาไทยที่แสดงมูลค่าของสีด้วยคอมพิวเตอร์ ข้อมูล คือ ภาพ 482 ภาพ ที่ใช้โนการทดลองได้จากการค้นหาภาพในอินเทอร์เน็ตโดยใช้ Google โดยใช้คำที่เป็นลักษณะของสีในภาษาไทย คือ “แดงอมส้ม” “ส้มอมแดง” “เหลืองอมส้ม” “ส้มอมเหลือง” “เหลืองแกมส้ม” “ส้มแกมเหลือง” “แดงเจือส้ม” และ “ส้มเจือแดง” แล้วจึงนำภาพที่ได้ไปทำการตัดหาพื้นที่ภาพที่ใช้ในการทดลองโดยนำไปให้กลุ่มทดลอง 100 คนตัดสินว่าเป็น สีใดเพื่อสร้างข้อมูลช่วยสอน และข้อมูลทดสอบ หลังจากนั้นจึงนำภาพมาประมวลผลการรับรู้ภาพด้วยคอมพิวเตอร์ โดยใช้ ทฤษฎีสีแบบ HSI
           ผลการศึกษาได้จำนวนภาพในสีที่ใช้ในการศึกษาจำนวน 371 ภาพ โดยภาพได้ที่ผ่านการคัดเลือกโดยกลุ่ม ทดลองที่ระดับความเชื่อมั่น ร้อยละ 95 ที่ขนาดสัดส่วน 0.6 โดยการทดลองแบ่งเป็น 2 ขั้นตอน คือ การจำแนกระดับ หยาบในขั้นตอนนี้ใช้การทดลอง สองแบบคือ แบบที่ 1 ใข้เพอร์เซปตรอนหลายขั้น ชนิดหลายกุล่ม และแบบที่ 2 ดำเนินการโดยใช้เทคนิคบนลงล่าง ร่วมกับเพอร์เซปตรอนหลายขั้น แบบสองกลุ่ม การดำเนินงานในระดับหยาบนี้ ใช้เวคเตอร์ Fuzzy membership function ผลการทดลองสามารถสกัดออกมาเป็นปัจจัย Latent Factorได้ 3 ปัจจัย แล้วจึงนำมาสร้างเวคเตอร์ลักษณะข้อมูล ประกอบด้วย 15 ลักษณะ ผลการทดลองพบว่า ได้ค่าเฉลี่ยความถูกต้องร้อยละ 74.03 ในขณะที่ใช้วิธีการแบบบนลงล่าง ทีละสองกลุ่มได้ค่าเฉลี่ยความถูกต้องในทุกระดับรวม คือ ร้อยละ 93.94 ในขั้นที่สอง ทำการลดปัจจัยด้วยวิธี Principal component analysis แบบหมุนแกนเพื่อเพิ่มประสิทธิภาพในการจำแนก ภาพสีในความหมายเซิงภาษาไทยในระดับสุดท้ายด้วยการบูรณาการ เทคนิคตรรกะแบบคลุมเครือ โดยใข้ฟ้งก์ซัน สมาซิก แบบ Gaussian ร่วมกับ นิรัลเนตเวอร์ค ที่เรียกว่า ANFIS ผลการทดลองการจำแนก “สีล้มแกมเหลือง” และ “สีเหลืองแกมส้ม” ได้ค่าเฉลี่ยความถูกต้องคือร้อยละ 84.3 การจำแนก “สีส้มอมเหลือง” และ “สีเหลืองอมส้ม” ได้ค่าเฉลี่ยความถูกต้องคือ ร้อยละ 79.3 ส่วนการจำแนก “สีแดงเจือส้ม” และ”สีส้มเจือแดง” ได้ค่าเฉลี่ยความถูกต้อง คือ ร้อยละ 81.8
คำสำคัญ : ตรรกศาสตร์คลุมเครือ, นิรัลเนตเวอร์ค, เพอร์เซปตรอน, HSI

           The objective of this study was to investigate the relationship between the color semantic in Thai language and the color in computer vision. The benefit of the study was the conducting of image retrieval using Thai name-entity and for automatic image archive 482 experiment images retrieved from Google search engine, n color domain of: “SOM_OM_DANG”(red in orange), “DANG_OM_SOM”, (orange in red), “LUANG_OM_SOM” (orange in yellow), “SOM_OM_LUANG” (yellow in orange), “LUANG_KAM_SOM” (yellow glassy orange), “SOM_KAM_LUANG” (orange glassy yellow), “DANG_JUA_SOM” (impure red with orange), and “SOM_JUA_DANG”(impure orange with red). The preparation of supervised data was as followed; first, the images were segmented to region of interest (ROD and then take into account of identifying the semantic colors of each image by 100 persons and then the color name of images were labeled based on the majority vote with 95 % confidence limit for the proportion test of greater than 60%. After the data preparation step, the final 371 image with color label, 15 features in HSI color model were extracted from each image and constructed supervised training data.The experiment consisted of coarse classification and fine classification. In coarse classification, we used two strategies to classify image: Multiclass perceptron and Top Down with Binary class perception, and found that the overall average precision was 74.03% and 93.94% respectively. Moreover, to enhance the efficient of rule formulation in Fuzzy logic set for fine classification, we conducted principal component to reduce the 15 features to three factors, and used Gaussian membership with the integration of neural network call ANFIS (Adaptive Neuro-Fuzzy Inference System). The technique was used to classify each image into semantic color in Thai language. We found that ANFIS can identify the color “LUANG_KAM_SOM” and “SOM_KAM_LUANG” were with precision of 84.3% while the precision of “SOM_OM_LUANG” and “LUANG_OM_SOM” were 79.3% and “SOM_JUA_DANG” and “DANG_JUA_SOM” were 81.8%.

Keywords : Fuzzy Logic, Neural Network, Perception, HSI


Full Text:

PDF

Refbacks

  • There are currently no refbacks.