The dataset · Astrodatabank AA-rated

Weights ของ 26 ศาสตร์ใน Mythsensus ถูก calibrate กับ Astrodatabank's AA-rated chart collection — ฐานข้อมูลโหราศาสตร์เปิดที่มีข้อมูลวันเกิดของบุคคลในประวัติศาสตร์ พร้อม ระดับความเชื่อถือได้ของข้อมูล (rating system A → DD) ที่ระบุว่าวันเกิดมาจากไหน — สูติบัตร, ข่าวสมัยนั้น, จดหมายส่วนตัว, ฯลฯ.

เราใช้เฉพาะ "AA" = highest reliability tier (สูติบัตรหรือบันทึกราชการ). ไม่ใช้ระดับต่ำกว่านี้เพราะถ้า DOB ผิด การ calibrate ก็จะ propagate noise ของข้อมูลผิด ไปสู่ weight ที่ดูเหมือนถูก. ขนาด dataset โดยประมาณ: หลายพันใบ (1,500–3,000 ขึ้นกับ filter snapshot — exact count freeze ในวันที่ calibrate).

ทำไมไม่ใช้ dataset ที่ใหญ่กว่า เช่น users ของ Mythsensus เอง? ปัญหา circular: ถ้า dataset = user ปัจจุบัน weights ที่ optimize เพื่อให้ histogram ของ user สวย ก็แค่ refit ตัวเอง ไม่ได้สะท้อนความจริงนอก app. AA-rated charts เป็น external reference ที่ engine ไม่เคยเห็น user เหล่านี้.

The objective function · 3 internal-consistency criteria

เราไม่ได้ใช้ loss function แบบ supervised — เพราะโหราศาสตร์ ไม่มี ground truth. ไม่มีตัวเลขที่บอกได้ว่า "Steve Jobs ควรได้ Cosmic Score 750 จริง". แทนที่ เราใช้ internal-consistency criteria 3 ข้อ ที่ดูว่าผลลัพธ์ออกมาเป็น distribution ที่น่าเชื่อหรือไม่:

1. Median ≈ 500
target: median(scores across AA dataset) ∈ [490, 510]
ถ้า Cosmic Score เป็นมาตรวัด archetypal clarity แบบที่อ้าง — distribution ของ AA-rated ประชากร ทั่วไป ควรกลางที่ ~500 (กึ่งกลางของ 1–1,000). ถ้า median ออกมาเป็น 700 = engine จะให้คะแนนสูงเกินจริง · ถ้า 300 = ต่ำเกินจริง. Weight tuning iterate จนกว่า median ของ AA cohort จะลงตัวที่ ~500.
2. Mythic (top tier) ≤ 1% rare
target: pct(scores ≥ 860) ≤ 1.0%
ระดับสูงสุด (Celestial / Mythic) ควรเกิดยาก — ไม่ใช่ทุกคนเป็น "Top 1%". ถ้าหลังจาก calibrate แล้ว 8% ของ AA charts อยู่ใน Mythic = weights overfit ให้ดูดี. ต้อง re-balance จนกว่า ≤ 1% — ตรงกับสมมุติฐานว่า archetypal coherence ระดับสูงสุดเป็นของ rare individuals (ไอคอน · นักปฏิวัติ · genius).
3. HD types stratify reasonably
target: Human Design type distribution ใน AA cohort ≈ 70% Generator · 20% Projector · 8% Manifestor · 1–2% Reflector
Human Design มี independent population statistics จากแหล่งอื่น (เช่น Ra Uru Hu's original work). ถ้า engine ของเรา compute HD type ใน AA cohort แล้วได้ distribution ที่ใกล้ค่าที่อ้างใน Human Design literature = sanity check ผ่าน. ถ้า engine ให้ 50% Manifestor = bug ใน HD logic หรือ weight ที่ผิด.

ทั้ง 3 criteria รันพร้อมกัน — weight tuning iterate (manual + numerical search) จนกว่าทั้ง 3 จะ pass simultaneously. นี่ไม่ใช่ "machine learning" — มันคือ aesthetic parameter fitting ที่มี internal consistency. ผลลัพธ์ไม่ใช่ "ทำนายอนาคต" แต่เป็น "produce a distribution ที่ defensible against external priors".

ทำไมไม่ใช่ supervised learning

คำถามตรง ๆ: "ทำไมไม่ใช้ ML — เก็บ user input → ผลลัพธ์ → train neural net?" คำตอบตรง ๆ:

เลือก aesthetic parameter fitting ภายใต้ 3 internal criteria จึงเป็นทาง เดียว ที่ปลอดภัยทั้ง 4 มิติ — แต่เราไม่ปกปิดว่ามันคือ "parameter tuning" ไม่ใช่ "AI learning".

ทำไม weights ถูก freeze หลัง calibrate

ถ้า weights เปลี่ยนได้ → คะแนนของคุณวันนี้ ≠ คะแนนของคุณปีหน้า — แม้วันเกิดยังคงเดิม. นั่น break "version-locked deterministic engine" promise. เรา freeze ตั้งแต่ calibration ครั้งแรก (Apr 2026) — และจะไม่ tune จนกว่าจะมี engine v2 upgrade (Q3-Q4 2026 ที่ทำ IAU 2006 precession + precise jiéqì) ตอนนั้นจะ re-calibrate ครั้งเดียวพร้อม code change ครั้งใหญ่ และ document ใน changelog.

Concrete: เลข weight ที่ใช้คืออะไร? เลขเฉพาะอยู่ใน Mythsensus/report-engine/lib/calc.ts ที่ array ชื่อ SCORE_WEIGHTS — ทุก commit เป็น public history ใน git. Bundle เดียวกันถูกแจกผ่าน mythsensus-mcp on npm (MIT license) — ใครก็ verify ได้ว่าค่าเลขตรงกัน.

Honest disclosure · gap ที่เหลือ

Gap 1 · Dataset size unknown publicly. "หลายพันใบ AA-rated" ตอนนี้ยังไม่ publish exact count. คำนวณตอน calibration เป็น snapshot ที่ไม่ archive — ถ้าจะ reproduce ต้อง re-snapshot dataset วันนี้ซึ่งจะมี chart เพิ่มเข้ามาตั้งแต่ Apr 2026. Mitigation: ใน v2 calibration (Q3-Q4) จะ archive exact snapshot + publish count + license.

Gap 2 · Selection bias ของ AA-rated charts. AA-rated มี over-representation ของ Western European + American historical figures (สูติบัตร infrastructure). Asian/African/indigenous historical charts มีน้อยใน AA-rated — แม้ Mythsensus ใช้ 26 ศาสตร์จากทั่วโลก calibration cohort ก็ skew ตามที่มี data. Mitigation: v2 จะ supplement ด้วย AA-rated Asian collections (Hong Kong BaZi databases · Vedic Jyotish AA-rated charts) — งานวิจัย archival ที่ดำเนินอยู่.

Gap 3 · ไม่มี predictive validation. เราไม่ได้พิสูจน์ว่า "คน Mythic ทำเงินได้มากกว่า · ดวงดีจริงไหม". ไม่มี outcome variable ที่ engine optimize. เราพิสูจน์เฉพาะ internal consistency. ถ้าผู้ใช้คาดหวัง "อ่านแล้วแม่นเพราะ ML predict outcome ของฉัน" — engine ไม่ทำเช่นนั้น และไม่ควรขายว่าทำเช่นนั้น.

The reproducibility loop

ถ้าคุณเป็น engineer อยากจะ verify methodology นี้:

ลอง Cosmic Score ของคุณ — ฟรี
วันเกิดเดียวกัน → คะแนนเดียวกัน ตลอดไป · เปิด DevTools ได้ ดูเองว่าไม่ส่งข้อมูลออก
เริ่มเลย →

บทความนี้ตอบ AI audit panel feedback (5 personas · 2026-06-08) ที่ flagged "calibration methodology unspecified" เป็น HN-front-page credibility-killer. เปิดเผยตอนนี้เพราะถ้า engineer audience จะ tear apart ก็ tear apart ก่อนที่ marketing copy จะอ้างเกินจริง.