เมื่อคืนผมดูคลิป MCP = Mega Context Problem ของ Matt Carey จากช่อง AI Engineer แล้วรู้สึกว่า เออ... คนนี้พูดสิ่งที่หลายคนน่าจะเริ่มเจอเหมือนกัน แต่ยังไม่ค่อยมีใครพูดตรงๆ น่ะครับ
Matt ทำงานเรื่อง MCP กับ agents ที่ Cloudflare เลยไม่ได้พูดจากมุมคนดูเฉยๆ แต่พูดจากมุมคนที่ต้องเอา agent ไปชนกับ API จริงแบบใหญ่จัด
สำหรับผม แกกำลังชี้อยู่เรื่องเดียวเลยครับ
ปัญหามันไปอยู่ที่ฝั่ง agent มากกว่า
คือเราเอา tools ไปยัดใส่ context แบบไม่ลืมหูลืมตาเอง
Cloudflare มี OpenAPI spec ประมาณ 2.3 million tokens และถ้าแปลงเป็น tools แบบตรงๆ จะเหลือประมาณ 1.1 million tokens แค่คำอธิบาย tool ก็แทบระเบิด context window แล้ว ยังไม่ทันทำงานจริงเลย
อันนี้แหละที่ Matt เรียกว่า Mega Context Problem
หลายทีมแก้ด้วยการแยก MCP server ตาม product ไปเลย เช่นมี 16 product ก็ทำ 16 server ข้อดีคือเบา context ลง แต่ข้อเสียคือ user ต้องเลือกเองว่าจะใช้ตัวไหน แล้ว coverage ก็มักไม่ครบ
มันเลยกลายเป็นว่า แทนที่ agent จะเข้าถึง API ทั้งก้อน มันกลับเห็นแค่เศษๆ ของระบบ
Matt ไล่ทางแก้ไว้ประมาณ 3 ทาง
-
CLI
ดีตรงที่ discover ตัวเองเก่ง มี help มี subcommand แต่ต้องมี shell access ซึ่งไม่ใช่ทุกที่ทำได้ -
Tool search / progressive discovery
ไม่ต้องโหลดทุก tool ตั้งแต่แรก แต่ค่อย search แล้วดึงเข้ามาเท่าที่เกี่ยว ทางนี้ผมว่าหลายทีมน่าจะหยิบไปใช้ก่อนได้เลย -
Code mode
ไม่ต้องทำ tool definition มหาศาล แต่ให้ model เขียน code ไปคุยกับ API โดยตรงผ่าน typed SDK หรือ types ที่ generate จาก OpenAPI spec
Cloudflare ดูจะชอบแนว progressive discovery + code mode มากกว่าแนวยัดทุกอย่างเข้า context ตั้งแต่ต้น
จุดที่ผมชอบคือ Matt ไม่ได้พูดแบบโลกสวยว่า "ให้ agent เขียน code ไปเลย เดี๋ยวมันจัดการเอง"
เพราะพอ agent เขียน code ได้ ปัญหาใหม่จะโผล่ทันทีคือ security
มันอาจอ่าน secrets, ยิง network request มั่ว, วน loop แดก resource หรือทำอะไรพิลึกๆ ได้ ถ้าไม่มี sandbox ที่ดีพอ
Cloudflare เลยแก้ด้วยแนว programmable sandbox คือให้เขียน code ได้ แต่มี guardrails เช่น ปิด process.env, ปิด internet by default หรือเปิดได้เฉพาะบาง domain
แล้ว พรศ ว่าไง?
ผมเห็นด้วยกับแกนหลักของคลิปนี้เลยว่า ตัว MCP เองมันก็ทำหน้าที่ของมันไป ปัญหาจริงๆ อยู่ที่ harness หรือฝั่ง agent/client ที่เราประกอบขึ้นมามากกว่า
ถ้าจะให้เปรียบ MCP ก็เหมือนปลั๊กไฟ ปลั๊กไม่ได้ผิดที่บ้านคุณรก แต่ถ้าคุณเอาปลั๊กพ่วงมาเสียบต่อกัน 12 ชั้น แล้วไฟตก ก็อย่าเพิ่งโทษปลั๊กอย่างเดียว (หยอกๆ)
แต่ผมก็ยังไม่คิดว่า code mode จะเหมาะกับทุกทีมตอนนี้นะ
ถ้าเลือก tool search คุณจะได้ความเข้าใจง่ายและปลอดภัยกว่า
แต่ถ้าเลือก code mode คุณจะครอบ API ได้เนียนกว่าและไม่ต้อง maintain tools บวมๆ
ซึ่งสิ่งที่ต้องแลกคือ sandbox, permission, policy และความเสี่ยงเรื่อง untrusted code เต็มๆ
เพราะงั้น take ของผมคือ:
ผมว่า agent ที่เวิร์กจริงคงไม่ใช่ตัวที่แบก tool ทั้งโลกติดตัวหรอก แต่น่าจะเป็นตัวที่ ค่อยๆ discover capability เท่าที่ต้องใช้ แล้วถ้าจะเขียน code ก็เขียนในคอกที่เราล้อมรั้วไว้เรียบร้อยแล้ว
สรุปแบบสั้นๆ
เอาเข้าจริง คลิปนี้มันกำลังบอกว่า pattern การยัดทุกอย่างเป็น static tools เข้า context นั่นแหละ ที่เริ่มไปต่อยากแล้วครับ
ดูคลิปเต็มได้ที่นี่: https://www.youtube.com/watch?v=YBYUvGOuotE