ความเข้าใจ AI รูปภาพ
ความสามารถ AI เข้าใจรูปภาพได้หลากหลายประเภท แต่ก็มีข้อจำกัดบางอย่างเช่นกัน ตัวอย่าง ประเภทของรูปภาพที่ AI มักจะ ❝ รู้ ❞ และ ❝ ไม่รู้ ❞ ตัวอย่างเช่น :
|
| ภาพทั้ง 2 เป็นภาพที่เหมือนกัน แต่มีความแตกต่างที่เกิดจาก AI |
✅ รูปภาพที่ AI ❝ รู้ ❞ หรือเข้าใจได้ดี
AI
มีความสามารถในการวิเคราะห์รูปภาพต่อไปนี้:
1. ภาพวัตถุชัดเจน (Object recognition)
ตัวอย่าง: รูปแอปเปิ้ล, สุนัข,
รถยนต์, ต้นไม้
ความสามารถ: บอกได้ว่าวัตถุนั้นคืออะไร, มีสีอะไร,
จำนวนเท่าไหร่
2. ภาพใบหน้า (Face detection)
ตัวอย่าง: ใบหน้าของบุคคลทั่วไป
ความสามารถ:
ตรวจจับใบหน้า, อารมณ์ (เช่น ยิ้ม เศร้า), อายุโดยประมาณ
(แต่จะไม่ระบุชื่อบุคคลเว้นแต่เป็นบุคคลสาธารณะระดับโลก)
3. ภาพข้อความ (OCR - Optical Character Recognition)
ตัวอย่าง:
รูปถ่ายหน้าหนังสือ, ป้ายชื่อ, เมนูอาหาร
ความสามารถ:
อ่านข้อความจากภาพและแปลงเป็นข้อความดิจิทัล
4. แผนภูมิ กราฟ ตาราง
ตัวอย่าง: กราฟแท่ง, pie chart, ตาราง Excel
ความสามารถ:
วิเคราะห์แนวโน้มข้อมูล หรือแปลงเป็นข้อมูลที่ใช้งานได้
ตัวอย่าง: แผนที่ Google Maps, ผังเมือง
ความสามารถ: ระบุถนน, เส้นทาง, พื้นที่ต่างๆ
❌ รูปภาพที่ AI “ไม่รู้” หรือเข้าใจได้ยาก
บางประเภทของภาพยังเป็นข้อจำกัดของ
AI:
1. ภาพที่มีความหมายแฝงซับซ้อน (Conceptual or Abstract art)ตัวอย่าง: ศิลปะนามธรรม, meme ที่ใช้บริบทเฉพาะ
เหตุผล: ความหมายขึ้นอยู่กับบริบททางวัฒนธรรมหรืออารมณ์
2. ภาพเบลอ/มืดเกินไป
ตัวอย่าง: ภาพที่ถ่ายในที่มืดจนมองไม่เห็นอะไร
เหตุผล: ข้อมูลภาพไม่เพียงพอสำหรับการวิเคราะห์
3. ภาพความละเอียดต่ำมาก (Pixelated images)
ตัวอย่าง: รูปภาพขนาด 16x16 พิกเซล
เหตุผล: ไม่สามารถระบุวัตถุได้จากข้อมูลจำกัด
4. ภาพที่มีการเซ็นเซอร์หรือปกปิด
ตัวอย่าง: ใบหน้าที่ถูกเบลอ, ป้ายทะเบียนที่ถูกปิด
เหตุผล: ข้อมูลสำคัญถูกลบหรือปิดไว้
5. ภาพที่มีเนื้อหาผิดกฎ เช่น
ภาพลามกอนาจาร ภาพที่แสดงความรุนแรงอย่างโจ่งแจ้ง
ภาพที่ละเมิดสิทธิส่วนบุคคล
🛑 AI จะไม่วิเคราะห์หรืออธิบายภาพที่ละเมิดนโยบายความปลอดภัยหรือจริยธรรม
ขนาดภาพและรายละเอียดภาพที่ AI ใช้ และเข้าใจ
|
| ความเข้าใจ AI ที่มีต่อรูปภาพขนาด 16:9 |
|
| ความเข้าใจ AI ที่มีต่อรูปภาพขนาด 1:1 |
✅ ขนาดและรายละเอียดของภาพที่ AI ใช้งานได้ดี
รายการและรายละเอียดขนาดที่แนะนำ 512x512 px ขึ้นไป (หรือมากกว่า)
สัดส่วนภาพ (aspect ratio) 1:1 (สี่เหลี่ยมจัตุรัส), 4:3, 16:9 ล้วนรองรับได้ดี
ความชัด (resolution) สูงกว่า 72 DPI จะทำให้ AI อ่านรายละเอียดได้ชัดเจนขึ้น โดยเฉพาะในภาพข้อความ
ความคมชัด (sharpness) ภาพควรไม่เบลอ, ไม่สั่นไหว
ไฟล์ภาพ รองรับ .jpg, .png, .webp, .gif (แต่ไม่รองรับภาพเคลื่อนไหวใน .gif)
รายละเอียดในภาพ ต้องมีแสงเพียงพอ, สีไม่ผิดเพี้ยน, องค์ประกอบไม่แน่นจนเกินไป
🔍 ตัวอย่างภาพที่เข้าใจได้ดี
ภาพถ่ายคนในแสงกลางวัน ขนาด 1024x768 pxภาพแผ่นกระดาษที่มีข้อความ ชัดเจน และไม่เอียง
⚠️ข้อจำกัดของภาพที่ AI เข้าใจได้ไม่ดี
|
| ความไม่เข้าใจ AI ที่มีต่อรูปภาพขนาด 1:1 ที่สร้างจาก AI |
ประเภทภาพ สาเหตุที่เข้าใจได้ยาก
ต่ำกว่า 256x256 px รายละเอียดน้อยเกินไป แยกวัตถุไม่ออกเบลอ, สั่น, มืด รายละเอียดเสียหาย ไม่สามารถตรวจจับวัตถุหรือข้อความได้ชัดเจน
ภาพที่มีวัตถุซ้อนกันมากเกินไป ทำให้ยากต่อการแยกวัตถุหรือวิเคราะห์บริบท
ภาพที่ตัดบางส่วนออก เช่น ตัดหน้า, ตัดคำในข้อความ จะทำให้การวิเคราะห์คลาดเคลื่อน
ภาพแคปหน้าจอที่มีการบีบอัดสูง (compressed) อาจเกิด artifact หรือจุดเบลอ ทำให้ OCR และ object detection ผิดพลาด
🧠 ความเข้าใจของ AI ต่อภาพ: ทำงานอย่างไร?
1. Image Preprocessing – ปรับภาพให้ตรงขนาดที่ AI ถนัด (เช่น 448x448 px)2. Feature Extraction – แยกส่วนสำคัญ เช่น เส้นขอบ, รูปร่าง, สี, ข้อความ
3. การตีความ (Understanding) – จับคู่สิ่งที่เห็นกับโมเดลที่ฝึกไว้ เช่น "นี่คือแมว", "นี่คือตัวอักษรไทย"
4. Contextual Reasoning (ในรุ่นขั้นสูง) – เข้าใจฉากหลัง ความสัมพันธ์ของวัตถุ และตีความแบบคนทำ



