วิเคราะห์เล่นๆ งบการเงิน Q2 2023 ของ Google ถ้ามีโฆษณาทั้งหมด 100 บาท Google ได้ไปประมาณ 83 บาท !!!
ไม่รู้คนอื่นคิดเหมือนผมไหมนะ แต่ผมว่าคนทำ content เห็นแ […]
เมื่อต้นปีที่ผ่านมา google บอกเองว่า content ที่สร้างโดย AI ถือว่าละเมิดกฏชุมชนของ google และหากตรวจสอบจะใช้การตรวจสอบด้วยคนจริงๆ และถ้าพบว่าใช้ AI เขียน content จริงๆ จะทำการแบนทั้งโดเมน (โครตโหด) >>>> อ่านข่าวเรื่อง Google Says AI Generated Content Is Against Guidelines
ผมก็เลยสงสัยจริงๆว่า google จะรู้ได้ยังไง ว่าอันไหน AI เขียน คือ AI ตัวใหม่ GPT-3 นี่โหดมากนะครับ เขียนได้เป็นธรรมชาติมาก แทบแยกไม่ออกเลยว่าอันไหนคน หรือ AI เขียน แต่เฉพาะภาษาอังกฤษนะ ภาษาไทยยังมั่วๆอยู่เยอะ ลองดูตัวอย่างที่ AI เขียนได้ที่ ตัวอย่างบทความที่ใช้ AI เขียน
แต่บางคนก็บอก ได้ดิ ขนาด fake news google ยังจัดการได้เลย ผมก็เลยลองไปค้นดู เออจริงวะ พอลองค้นอะไรที่เป็น fake news มันจะขึ้นเนื้อหาที่บอกว่าอันนี้เป็น fake news นะ ขึ้นมาเลยอันดับแรก หรือล่าสุดที่บอกว่าชัชชาติใช้งบ 8 ล้าน ค่าหนังกลางแปลง ค้นไปแล้ว ขึ้นแต่ข่าวที่บอกว่าเรื่องงบ 8 ล้านนี่ไม่จริงทั้งนั้นเลย แล้ว google มันรู้ได้ไงว่าอันไหนจริงไม่จริงวะ
แต่ผมก็นั่งคิดนะ บางที spam ง่อยๆ หรือพวกเว็บพนันที่ฝากลิ้งจากการแฮกเว็บชาวบ้าน google ยังจัดการไม่ได้เลย อะไรที่ advance แบบนี้ google จะจัดการได้หรอ
และด้วยความใคร่รู้ เลยไปไล่อ่านบทความภาษาอังกฤษ กับที่ฝรั่งมันคุยกัน ว่า google จัดการกับ content ที่สร้างโดย AI ได้อย่างไร
มีคนนึงตั้งทฤษฎีไว้น่าสนใจมาก
ทฤษฎีนั้นบอกว่า “Google ใช้ Blockchain ในการสู้กับ content generated by AI”
คือออกตัวก่อนว่า ผมไม่ค่อยเข้าใจอะไรเกี่ยวกับ Blockchain ลึกซึ้งนะครับ แต่ทฤษฎีคร่าวๆคือประมาณว่า original content จะอยู่ใน block ซึ่งยืนยันได้ว่าอันนี้มี 1 เดียว จากนั้นใช้ AI สร้าง context ขึ้นมาจาก original article พวกนั้น จากนั้นถ้าเจอ article ไหน ที่มี context เหมือนกับ original article ก็จะดันอันดับลงไปข้างล่าง ไม่ให้อยู่สูงกว่า original
ซึ่งผมไม่รู้ว่าจริงเท็จแค่ไหนนะครับ หรือไอ้คนที่โพสต์ที่ผมไปอ่านมา มันแค่กาวไปเอง แต่ถ้า google ใช้วิธีนี้ได้จริงๆ อย่างว่าแต่วงการ content generated by AI สะเทือนเลยครับ วงการ rewrite by human ก็สะเทือนเหมือนกัน
อีกทฤษฎีที่น่าสนใจและมีการใช้แล้วจริงๆคือการใช้ AI อีกตัวจับ content ที่สร้างโดย AI
ตัวอย่างที่เห็นชัดเจนคือ https://detectchatgpt.com/ ซึ่งหลักการก็คือใช้ AI เรียนรู้ content ที่ AI อย่าง ChatGPT สร้างขึ้นมา แล้วบอกเราว่าข้อความดังกล่าวมีโอกาสสร้างมาจาก ChatGPT กี่ % ซึ่งค่อนข้างแม่นยำทีเดียว ดังรูป
ทฤษฎีนี้ว่าด้วยเรื่องการที่ content ที่ AI สร้างขึ้น จะมี pattern ที่เป็นเอกลักษณ์เฉพาะ จากโครงสร้างการทำงานของ neural network ซึ่งโครงสร้างการสร้างคำจะมีรูปแบบเฉพาะที่สามารถตรวจจับได้ รูปแบบที่เกิดจากการทำงานที่มีโครงสร้างเฉพาะของ neural network จะมีความเฉพาะตัวคล้ายๆเป็นลายน้ำว่ามาจากของ AI ตัวนี้
นอกจากนี้ การเขียนโดยคนจริงๆ จะมีสิ่งที่เรียกว่า style ของนักเขียน ซึ่งเป็นเอกลักษณ์เฉพาะตัวของนักเขียนแต่ละคน ซึ่ง Google จะจดจำลักษณะเฉพาะของนักเขียนแต่ละคนได้ ลักษณะเฉพาะพวกนี้เรียกว่า Author Vectors และ Author Recognition ซึ่งเมื่อนำไปเปรียบเทียบกับ Watermark ที่เกิดจาก AI generated content Google ก็จะแยกได้ทันทีว่า content นี้ เป็น AI หรือคนจริงๆเขียน
ทฤษฏีเรื่อง Watermark นี้ ได้รับการยอมรับอย่างมาก โดยเฉพาะกับเทพเจ้าด้าน SEO อย่าง Koray Tuğberk GÜBÜR ซึ่งได้ขึ้นชื่อว่าเป็นนักทำ SEO ที่เข้าใจ Algorithm ของ Google อย่างถ่องแท้คนนึงของโลก