Google สู้กับ Content ที่สร้างโดย AI ได้อย่างไร

กรกฎาคม 9, 2022

เมื่อต้นปีที่ผ่านมา google บอกเองว่า content ที่สร้างโดย AI ถือว่าละเมิดกฏชุมชนของ google และหากตรวจสอบจะใช้การตรวจสอบด้วยคนจริงๆ และถ้าพบว่าใช้ AI เขียน content จริงๆ จะทำการแบนทั้งโดเมน (โครตโหด) >>>> อ่านข่าวเรื่อง Google Says AI Generated Content Is Against Guidelines

ผมก็เลยสงสัยจริงๆว่า google จะรู้ได้ยังไง ว่าอันไหน AI เขียน คือ AI ตัวใหม่ GPT-3 นี่โหดมากนะครับ เขียนได้เป็นธรรมชาติมาก แทบแยกไม่ออกเลยว่าอันไหนคน หรือ AI เขียน แต่เฉพาะภาษาอังกฤษนะ ภาษาไทยยังมั่วๆอยู่เยอะ ลองดูตัวอย่างที่ AI เขียนได้ที่ ตัวอย่างบทความที่ใช้ AI เขียน

แต่บางคนก็บอก ได้ดิ ขนาด fake news google ยังจัดการได้เลย ผมก็เลยลองไปค้นดู เออจริงวะ พอลองค้นอะไรที่เป็น fake news มันจะขึ้นเนื้อหาที่บอกว่าอันนี้เป็น fake news นะ ขึ้นมาเลยอันดับแรก หรือล่าสุดที่บอกว่าชัชชาติใช้งบ 8 ล้าน ค่าหนังกลางแปลง ค้นไปแล้ว ขึ้นแต่ข่าวที่บอกว่าเรื่องงบ 8 ล้านนี่ไม่จริงทั้งนั้นเลย แล้ว google มันรู้ได้ไงว่าอันไหนจริงไม่จริงวะ

แต่ผมก็นั่งคิดนะ บางที spam ง่อยๆ หรือพวกเว็บพนันที่ฝากลิ้งจากการแฮกเว็บชาวบ้าน google ยังจัดการไม่ได้เลย อะไรที่ advance แบบนี้ google จะจัดการได้หรอ

และด้วยความใคร่รู้ เลยไปไล่อ่านบทความภาษาอังกฤษ กับที่ฝรั่งมันคุยกัน ว่า google จัดการกับ content ที่สร้างโดย AI ได้อย่างไร

มีคนนึงตั้งทฤษฎีไว้น่าสนใจมาก

ทฤษฎีนั้นบอกว่า “Google ใช้ Blockchain ในการสู้กับ content generated by AI”

คือออกตัวก่อนว่า ผมไม่ค่อยเข้าใจอะไรเกี่ยวกับ Blockchain ลึกซึ้งนะครับ แต่ทฤษฎีคร่าวๆคือประมาณว่า original content จะอยู่ใน block ซึ่งยืนยันได้ว่าอันนี้มี 1 เดียว จากนั้นใช้ AI สร้าง context ขึ้นมาจาก original article พวกนั้น จากนั้นถ้าเจอ article ไหน ที่มี context เหมือนกับ original article ก็จะดันอันดับลงไปข้างล่าง ไม่ให้อยู่สูงกว่า original

ซึ่งผมไม่รู้ว่าจริงเท็จแค่ไหนนะครับ หรือไอ้คนที่โพสต์ที่ผมไปอ่านมา มันแค่กาวไปเอง แต่ถ้า google ใช้วิธีนี้ได้จริงๆ อย่างว่าแต่วงการ content generated by AI สะเทือนเลยครับ วงการ rewrite by human ก็สะเทือนเหมือนกัน

อีกทฤษฎีนึงที่ดูเป็นไปได้มากกว่า คือใช้ AI ตรวจจับ AI

อีกทฤษฎีที่น่าสนใจและมีการใช้แล้วจริงๆคือการใช้ AI อีกตัวจับ content ที่สร้างโดย AI

ตัวอย่างที่เห็นชัดเจนคือ https://detectchatgpt.com/ ซึ่งหลักการก็คือใช้ AI เรียนรู้ content ที่ AI อย่าง ChatGPT สร้างขึ้นมา แล้วบอกเราว่าข้อความดังกล่าวมีโอกาสสร้างมาจาก ChatGPT กี่ % ซึ่งค่อนข้างแม่นยำทีเดียว ดังรูป

ทฤษฎีสุดท้าย ทฤษฎีที่ได้รับการยอมรับมากที่สุด ทฤษฎี Watermark

ทฤษฎีนี้ว่าด้วยเรื่องการที่ content ที่ AI สร้างขึ้น จะมี pattern ที่เป็นเอกลักษณ์เฉพาะ จากโครงสร้างการทำงานของ neural network ซึ่งโครงสร้างการสร้างคำจะมีรูปแบบเฉพาะที่สามารถตรวจจับได้ รูปแบบที่เกิดจากการทำงานที่มีโครงสร้างเฉพาะของ neural network จะมีความเฉพาะตัวคล้ายๆเป็นลายน้ำว่ามาจากของ AI ตัวนี้

นอกจากนี้ การเขียนโดยคนจริงๆ จะมีสิ่งที่เรียกว่า style ของนักเขียน ซึ่งเป็นเอกลักษณ์เฉพาะตัวของนักเขียนแต่ละคน ซึ่ง Google จะจดจำลักษณะเฉพาะของนักเขียนแต่ละคนได้ ลักษณะเฉพาะพวกนี้เรียกว่า Author Vectors และ Author Recognition ซึ่งเมื่อนำไปเปรียบเทียบกับ Watermark ที่เกิดจาก AI generated content Google ก็จะแยกได้ทันทีว่า content นี้ เป็น AI หรือคนจริงๆเขียน

ทฤษฏีเรื่อง Watermark นี้ ได้รับการยอมรับอย่างมาก โดยเฉพาะกับเทพเจ้าด้าน SEO อย่าง Koray Tuğberk GÜBÜR ซึ่งได้ขึ้นชื่อว่าเป็นนักทำ SEO ที่เข้าใจ Algorithm ของ Google อย่างถ่องแท้คนนึงของโลก

Pitipat

จบการศึกษาเภสัชศาสตรบัณฑิต จากมหาวิทยาลัยขอนแก่น ทำงานในแวดวงอุตสาหกรรมยามานานกว่า 10 ปี เชี่ยวชาญด้าน QC/QA นอกจากนี้ยังมีประสบการณ์ทางด้านร้านยา เคยเปิดร้านยาของตนเอง หากมีเวลาว่างมักไป part time ร้านยาต่างๆ และเคยดูแลร้านยาให้กับเจ้าของบริษัทที่ทำงาน ชื่นชอบการทำเว็บไซต์ สนใจด้าน Internet Marketing และเทคโนโลยี ทำเว็บไซต์ และ SEO เป็นงานอดิเรก ดูเพิ่มเติม

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

อีกทฤษฎีนึงที่ดูเป็นไปได้มากกว่า คือใช้ AI ตรวจจับ AI

ทฤษฎีสุดท้าย ทฤษฎีที่ได้รับการยอมรับมากที่สุด ทฤษฎี Watermark

Pitipat

Related Posts

วิเคราะห์เล่นๆ งบการเงิน Q2 2023 ของ Google ถ้ามีโฆษณาทั้งหมด 100 บาท Google ได้ไปประมาณ 83 บาท !!!

เรื่อง AI กับลิขสิทธิ์ต้นฉบับของคนสร้างสรรค์ผลงานนี่ มันจะจบยังไง???

แชร์ประสบการณ์และตัวอย่างการทำ affiliate ของคุณเป็ปเปอร์