AI Vision Deep Learning

AI Vision Deep learning เป็นการประยุกต์ความรู้ใน Computer Vision นำมาใช้กับระบบ Machine Vision การที่เราสามารถบันทึกภาพเข้าไปในระบบจากนั้นเราบอกว่าภาพไหนเป็นภาพที่ดีภาพถ่ายเป็นภาพที่เสียระบบการสร้างโปรแกรมเพื่อตรวจสอบภาพตัดต่อไปด้วยตัวเอง สามารถช่วยในการตรวจสอบชิ้นงานที่มีความแปรปรวนของภาพที่มีลักษณะ Texture ที่หลากหลายซึ่งเป็นปัญหาอย่างมากของการใช้ระบบ Machine Vision แบบ Traditional หรือ Rule-based algorithms

Traditional Machine Vision หรือ Rule-based algorithms

หลักการทำงานของ Rule-Base machine vision เราจะต้องกำหนดเงื่อนไขของสิ่งที่ต้องการตรวจสอบเข้าไปก่อนระบบถึงจะให้คำตอบให้เราได้ ไม่ว่าจะเป็น ระบบ Gray Scale จำนวน Pixel ขนาดต่างๆ หมายความว่า เราจะต้องเอา Feature ที่กล้องจับได้มา กำหนดเงื่อนไข ให้ว่าต้องมีมากกน้อยแค่ไหนจึงผ่าน หรือจะแยกประเภทได้ ยกตัวอย่างตามรูปด้านล่าง

จากรูปตัวอย่างด้านบนเราสามารถแยกชนิดของถั่วได้ว่าเป็น Wal nut, Hazel nut หรือ Cashew nut จากการเช็คความเข้มแสง (Intensity) ของชิ้นงาน แต่ละอันได้หลังจากที่แปลงเป็นภาพ grey image แล้วรวมถึงเราสามารถวัดจำนวนพิกเซล (Area) ได้ สามารถตรวจสอบความกลมของรูปได้ (Circularity)
จากข้อมูลทั้งหมดแล้วเอามากำหนดเป็นเงื่อนไขแต่ละอย่างเพื่อแยกประเภทของของรูปว่าเป็นอะไร

แต่ถ้า Data set เป็นแบบนี้เราจะไม่สามารถแยกชนิดของถั่วได้ว่าเป็น Wal nut, Hazel nut หรือ Cashew nut ได้ เนื่องความเข้มแสง (Intensity) ของชิ้นงาน แต่ละอันได้หลังจากที่แปลงเป็นภาพ grey image ไม่ต่างกันมาก จำนวนพิกเซล (Area) อาจจะพอแยกได้ ความกลมของรูป (Circularity) ถือว่สไม่ต่างกันมาก จากข้อมูลทั้งหมดเราไม่สามารถกำหนดเป็นเงื่อนไขแต่ละอย่างเพื่อแยกประเภทของของรูปว่าเป็นอะไร ได้อย่างแม่นยำ ด้วยสาเหตุนี้เราจึงจำเป็นต้องใช้ AI deep Learning

หลักการทำงานของ AI Vision deep learning

เราใส่รูป โดยแยกประเภทให้ชัดเจนว่าเป็นภาพดีหรือภาพเสีย จากนั้นเราโหลดเข้าไปในระบบ ระบบจะทำการ train เพื่อหา algorithms ที่เหมาะสมที่จะตรวจสอบต่อไป

ลักษณะงานที่เหมาะกับการนำ AI Vision Deep Learning ไปประยุกต์ใช้งานมีดังต่อไปนี้

  • การตรวจจับข้อบกพร่องของพื้นผิวและรูปร่าง (เช่น รอยแตก การผิดรูป การเปลี่ยนสี)
  • การตรวจจับตัวอย่างที่ผิดปกติหรือไม่คาดคิด (เช่น ชิ้นส่วนที่ขาดหายไป แตกหัก หรือคุณภาพต่ำ)
  • การระบุวัตถุหรือภาพที่เกี่ยวกับประเภทที่กำหนดไว้ล่วงหน้า (เช่น เครื่องคัดแยก)
  • ตำแหน่ง การแบ่งส่วน และการแบ่งประเภทของวัตถุหลายชิ้นภายในรูปภาพ (เช่น การเลือกถัง)
  • การวิเคราะห์คุณภาพผลิตภัณฑ์ (รวมถึงผลไม้ พืช ไม้และผลิตภัณฑ์อินทรีย์อื่นๆ)
  • ตำแหน่งและการจัดหมวดหมู่ของประเด็นสำคัญ ภูมิภาคที่มีลักษณะเฉพาะ และวัตถุขนาดเล็ก
  • การตรวจสอบตัวหนังสือ optical character recognition (OCR)

การใช้ฟังก์ชัน AI deep learning ประกอบด้วยสองขั้นตอน:

Training – การสร้างแบบจำลองตามคุณสมบัติที่เรียนรู้จากตัวอย่างการ training
Inference – การใช้แบบจำลองกับภาพใหม่เพื่อดำเนินการตรวจสอบด้วยระบบวิชันซิสเต็มจริง

ประเภทของ tool ที่ใช้งานในระบบ AI Vision Deep Learning

1. Anomaly Detection

เทคนิคนี้ใช้ในการตรวจหาตัวอย่างที่ผิดปกติ ต้องใช้ตัวอย่างที่ปราศจากข้อผิดพลาด (OK samples)เพื่อเรียนรู้โมเดลปกติ ตัวเลือกอื่นสามารถเพิ่มตัวอย่างเท็จ (NG samples) ได้หลายตัวอย่างเพื่อกำหนดขีดจำกัดรูปแบบที่ยอมรับได้ดีกว่า เครื่องมือนี้มีประโยชน์อย่างยิ่งในกรณีที่ระบุข้อบกพร่องทุกประเภทที่เป็นไปได้ได้ยาก หรือในกรณีที่ไม่มีตัวอย่างเชิงลบ (NG sample) ผลลัพธ์ของเครื่องมือนี้คือ: ผลลัพธ์ที่จัดหมวดหมู่ (OK/ NG) คะแนนความผิดปกติและ Heat Map (คร่าวๆ) ของความผิดปกติในภาพ

Image

ซ้าย: รูปภาพต้นฉบับที่มีชิ้นส่วนที่ขาดหายไป
ขวา: ผลการตรวจสอบ พร้อม Heatmap ของ anomaly

2. Feature Detection (segmentation)

เทคนิคนี้ใช้เพื่อแบ่งกลุ่มหรือแยกประเภท คุณสมบัติของพิกเซลภายในภาพได้อย่างแม่นยำ พิกเซลที่เป็นของแต่ละคลาสจะต้องถูกทำเครื่องหมายโดยผู้ใช้ในขั้นตอนการ train ผลลัพธ์ของเทคนิคนี้คืออาร์เรย์ของแผนที่ความน่าจะเป็นสำหรับทุกประเภท

Image

ซ้าย: ภาพต้นฉบับของอวัยวะ     ขวา: การแบ่งส่วนของหลอดเลือด

3. Object Classification

เทคนิคนี้ใช้เพื่อแยกประเภทวัตถุในพื้นที่ที่เลือก โดยถูกกำหนดโด้วยผู้ใช้ ในตอนแรกที่ training เราจำเป็นต้องจัดเตรียม training set ของรูปภาพที่ระบุประเภทกำกับ ผลลัพธ์ของเทคนิคนี้คือ: ชื่อของประเภทที่ตรวจพบและระดับความมั่นใจในการจัดหมวดหมู่

Image

ซ้าย: ภาพต้นฉบับ     ขวา: รายการผลลัพธ์ของวัตถุที่ตรวจพบ

4. Instance Segmentation

เทคนิคนี้ใช้เพื่อค้นหา แบ่งส่วน และจำแนกวัตถุหนึ่งหรือหลายวัตถุภายในรูปภาพ การ training ต้องการให้ผู้ใช้วาดขอบเขตที่สอดคล้องกับวัตถุในภาพและกำหนดประเภทให้กับภาพต่างๆ ผลลัพธ์คือรายการประเภทของวัตถุ ขอบเขต ตำแหน่ง ชื่อวัตถุ และระดับความเหมือน เหมาะสำหรับการนับจำนวนชิ้นงานที่นับยาก

ซ้าย: ภาพต้นฉบับ     ขวา: รายการผลลัพธ์ของวัตถุที่ตรวจพบ

5. Point Location

เทคนิคนี้ใช้เพื่อระบุตำแหน่งและจำแนกจุดสำคัญของชิ้นส่วนที่มีลักษณะเฉพาะ และวัตถุขนาดเล็กภายในภาพได้อย่างแม่นยำ การ train กำหนดให้ผู้ใช้ทำเครื่องหมายตำแหน่งของจุกแต่ละจุดให้ละเอียดบนรูปภาพที่ใช้ train ผลลัพธ์ที่ได้คือตำแหน่งจุดต่างๆ ที่ predict ไว้พร้อมกับตำแหน่ง และคะแนนความเชื่อมั่นที่สอดคล้องกัน

ซ้าย: ภาพต้นฉบับ     ขวา: รายการผลลัพธ์ของจุดที่ตรวจพบ

6. Reading Characters (OCR)

เทคนิคคือใช้เพื่อค้นหาและจดจำอักขระภายในภาพ ผลลัพธ์คือรายการอักขระที่พบ

ตัวอย่างการประยุกต์ใช้งาน

ขอบคุณข้อมูลจาก www.adaptive-vision.com