AI Vision

AI Vision Deep Learning

AI Vision Deep learning เป็นการประยุกต์ความรู้ใน Computer Vision นำมาใช้กับระบบ Machine Vision การที่เราสามารถบันทึกภาพเข้าไปในระบบจากนั้นเราบอกว่าภาพไหนเป็นภาพที่ดีภาพถ่ายเป็นภาพที่เสียระบบการสร้างโปรแกรมเพื่อตรวจสอบภาพตัดต่อไปด้วยตัวเอง สามารถช่วยในการตรวจสอบชิ้นงานที่มีความแปรปรวนของภาพที่มีลักษณะ Texture ที่หลากหลายซึ่งเป็นปัญหาอย่างมากของการใช้ระบบ Machine Vision แบบ Traditional หรือ Rule-based algorithms

Traditional Machine Vision หรือ Rule-based algorithms

หลักการทำงานของ Rule-Base machine vision เราจะต้องกำหนดเงื่อนไขของสิ่งที่ต้องการตรวจสอบเข้าไปก่อนระบบถึงจะให้คำตอบให้เราได้ ไม่ว่าจะเป็น ระบบ Gray Scale จำนวน Pixel ขนาดต่างๆ หมายความว่า เราจะต้องเอา Feature ที่กล้องจับได้มา กำหนดเงื่อนไข ให้ว่าต้องมีมากกน้อยแค่ไหนจึงผ่าน หรือจะแยกประเภทได้ ยกตัวอย่างตามรูปด้านล่าง

จากรูปตัวอย่างด้านบนเราสามารถแยกชนิดของถั่วได้ว่าเป็น Wal nut, Hazel nut หรือ Cashew nut จากการเช็คความเข้มแสง (Intensity) ของชิ้นงาน แต่ละอันได้หลังจากที่แปลงเป็นภาพ grey image แล้วรวมถึงเราสามารถวัดจำนวนพิกเซล (Area) ได้ สามารถตรวจสอบความกลมของรูปได้ (Circularity)
จากข้อมูลทั้งหมดแล้วเอามากำหนดเป็นเงื่อนไขแต่ละอย่างเพื่อแยกประเภทของของรูปว่าเป็นอะไร

แต่ถ้า Data set เป็นแบบนี้เราจะไม่สามารถแยกชนิดของถั่วได้ว่าเป็น Wal nut, Hazel nut หรือ Cashew nut ได้ เนื่องความเข้มแสง (Intensity) ของชิ้นงาน แต่ละอันได้หลังจากที่แปลงเป็นภาพ grey image ไม่ต่างกันมาก จำนวนพิกเซล (Area) อาจจะพอแยกได้ ความกลมของรูป (Circularity) ถือว่สไม่ต่างกันมาก จากข้อมูลทั้งหมดเราไม่สามารถกำหนดเป็นเงื่อนไขแต่ละอย่างเพื่อแยกประเภทของของรูปว่าเป็นอะไร ได้อย่างแม่นยำ ด้วยสาเหตุนี้เราจึงจำเป็นต้องใช้ AI deep Learning

หลักการทำงานของ AI Vision deep learning

เราใส่รูป โดยแยกประเภทให้ชัดเจนว่าเป็นภาพดีหรือภาพเสีย จากนั้นเราโหลดเข้าไปในระบบ ระบบจะทำการ train เพื่อหา algorithms ที่เหมาะสมที่จะตรวจสอบต่อไป

ลักษณะงานที่เหมาะกับการนำ AI Vision Deep Learning ไปประยุกต์ใช้งานมีดังต่อไปนี้

การตรวจจับข้อบกพร่องของพื้นผิวและรูปร่าง (เช่น รอยแตก การผิดรูป การเปลี่ยนสี)
การตรวจจับตัวอย่างที่ผิดปกติหรือไม่คาดคิด (เช่น ชิ้นส่วนที่ขาดหายไป แตกหัก หรือคุณภาพต่ำ)
การระบุวัตถุหรือภาพที่เกี่ยวกับประเภทที่กำหนดไว้ล่วงหน้า (เช่น เครื่องคัดแยก)
ตำแหน่ง การแบ่งส่วน และการแบ่งประเภทของวัตถุหลายชิ้นภายในรูปภาพ (เช่น การเลือกถัง)
การวิเคราะห์คุณภาพผลิตภัณฑ์ (รวมถึงผลไม้ พืช ไม้และผลิตภัณฑ์อินทรีย์อื่นๆ)
ตำแหน่งและการจัดหมวดหมู่ของประเด็นสำคัญ ภูมิภาคที่มีลักษณะเฉพาะ และวัตถุขนาดเล็ก
การตรวจสอบตัวหนังสือ optical character recognition (OCR)

การใช้ฟังก์ชัน AI deep learning ประกอบด้วยสองขั้นตอน:

Training – การสร้างแบบจำลองตามคุณสมบัติที่เรียนรู้จากตัวอย่างการ training
Inference – การใช้แบบจำลองกับภาพใหม่เพื่อดำเนินการตรวจสอบด้วยระบบวิชันซิสเต็มจริง

ประเภทของ tool ที่ใช้งานในระบบ AI Vision Deep Learning

1. Anomaly Detection

เทคนิคนี้ใช้ในการตรวจหาตัวอย่างที่ผิดปกติ ต้องใช้ตัวอย่างที่ปราศจากข้อผิดพลาด (OK samples)เพื่อเรียนรู้โมเดลปกติ ตัวเลือกอื่นสามารถเพิ่มตัวอย่างเท็จ (NG samples) ได้หลายตัวอย่างเพื่อกำหนดขีดจำกัดรูปแบบที่ยอมรับได้ดีกว่า เครื่องมือนี้มีประโยชน์อย่างยิ่งในกรณีที่ระบุข้อบกพร่องทุกประเภทที่เป็นไปได้ได้ยาก หรือในกรณีที่ไม่มีตัวอย่างเชิงลบ (NG sample) ผลลัพธ์ของเครื่องมือนี้คือ: ผลลัพธ์ที่จัดหมวดหมู่ (OK/ NG) คะแนนความผิดปกติและ Heat Map (คร่าวๆ) ของความผิดปกติในภาพ

ซ้าย: รูปภาพต้นฉบับที่มีชิ้นส่วนที่ขาดหายไป
ขวา: ผลการตรวจสอบ พร้อม Heatmap ของ anomaly

2. Feature Detection (segmentation)

เทคนิคนี้ใช้เพื่อแบ่งกลุ่มหรือแยกประเภท คุณสมบัติของพิกเซลภายในภาพได้อย่างแม่นยำ พิกเซลที่เป็นของแต่ละคลาสจะต้องถูกทำเครื่องหมายโดยผู้ใช้ในขั้นตอนการ train ผลลัพธ์ของเทคนิคนี้คืออาร์เรย์ของแผนที่ความน่าจะเป็นสำหรับทุกประเภท

ซ้าย: ภาพต้นฉบับของอวัยวะ ขวา: การแบ่งส่วนของหลอดเลือด

3. Object Classification

เทคนิคนี้ใช้เพื่อแยกประเภทวัตถุในพื้นที่ที่เลือก โดยถูกกำหนดโด้วยผู้ใช้ ในตอนแรกที่ training เราจำเป็นต้องจัดเตรียม training set ของรูปภาพที่ระบุประเภทกำกับ ผลลัพธ์ของเทคนิคนี้คือ: ชื่อของประเภทที่ตรวจพบและระดับความมั่นใจในการจัดหมวดหมู่

ซ้าย: ภาพต้นฉบับ ขวา: รายการผลลัพธ์ของวัตถุที่ตรวจพบ

4. Instance Segmentation

เทคนิคนี้ใช้เพื่อค้นหา แบ่งส่วน และจำแนกวัตถุหนึ่งหรือหลายวัตถุภายในรูปภาพ การ training ต้องการให้ผู้ใช้วาดขอบเขตที่สอดคล้องกับวัตถุในภาพและกำหนดประเภทให้กับภาพต่างๆ ผลลัพธ์คือรายการประเภทของวัตถุ ขอบเขต ตำแหน่ง ชื่อวัตถุ และระดับความเหมือน เหมาะสำหรับการนับจำนวนชิ้นงานที่นับยาก

ซ้าย: ภาพต้นฉบับ ขวา: รายการผลลัพธ์ของวัตถุที่ตรวจพบ

5. Point Location

เทคนิคนี้ใช้เพื่อระบุตำแหน่งและจำแนกจุดสำคัญของชิ้นส่วนที่มีลักษณะเฉพาะ และวัตถุขนาดเล็กภายในภาพได้อย่างแม่นยำ การ train กำหนดให้ผู้ใช้ทำเครื่องหมายตำแหน่งของจุกแต่ละจุดให้ละเอียดบนรูปภาพที่ใช้ train ผลลัพธ์ที่ได้คือตำแหน่งจุดต่างๆ ที่ predict ไว้พร้อมกับตำแหน่ง และคะแนนความเชื่อมั่นที่สอดคล้องกัน