The dataset · Astrodatabank AA-rated
Weights ของ 26 ศาสตร์ใน Mythsensus ถูก calibrate กับ Astrodatabank's AA-rated chart collection — ฐานข้อมูลโหราศาสตร์เปิดที่มีข้อมูลวันเกิดของบุคคลในประวัติศาสตร์ พร้อม ระดับความเชื่อถือได้ของข้อมูล (rating system A → DD) ที่ระบุว่าวันเกิดมาจากไหน — สูติบัตร, ข่าวสมัยนั้น, จดหมายส่วนตัว, ฯลฯ.
เราใช้เฉพาะ "AA" = highest reliability tier (สูติบัตรหรือบันทึกราชการ). ไม่ใช้ระดับต่ำกว่านี้เพราะถ้า DOB ผิด การ calibrate ก็จะ propagate noise ของข้อมูลผิด ไปสู่ weight ที่ดูเหมือนถูก. ขนาด dataset โดยประมาณ: หลายพันใบ (1,500–3,000 ขึ้นกับ filter snapshot — exact count freeze ในวันที่ calibrate).
The objective function · 3 internal-consistency criteria
เราไม่ได้ใช้ loss function แบบ supervised — เพราะโหราศาสตร์ ไม่มี ground truth. ไม่มีตัวเลขที่บอกได้ว่า "Steve Jobs ควรได้ Cosmic Score 750 จริง". แทนที่ เราใช้ internal-consistency criteria 3 ข้อ ที่ดูว่าผลลัพธ์ออกมาเป็น distribution ที่น่าเชื่อหรือไม่:
ทั้ง 3 criteria รันพร้อมกัน — weight tuning iterate (manual + numerical search) จนกว่าทั้ง 3 จะ pass simultaneously. นี่ไม่ใช่ "machine learning" — มันคือ aesthetic parameter fitting ที่มี internal consistency. ผลลัพธ์ไม่ใช่ "ทำนายอนาคต" แต่เป็น "produce a distribution ที่ defensible against external priors".
ทำไมไม่ใช่ supervised learning
คำถามตรง ๆ: "ทำไมไม่ใช้ ML — เก็บ user input → ผลลัพธ์ → train neural net?" คำตอบตรง ๆ:
- ไม่มี label. "ดวงดี / ดวงร้าย" เป็น label ที่ subjective แตกต่างกันทุกคน. user input "ฉันชอบงานปัจจุบัน" ≠ "งานนี้เหมาะกับ archetype ของฉัน" — สอง concept ที่คนละมิติ.
- ML overfit แน่ นอนสิ. เก็บ data จาก user 10,000 คน, train classifier ที่ predict "user จะ rate Cosmic Score ว่าตรงไหม". ก็จะได้ engine ที่ optimize self-reported satisfaction — ขายดีขึ้น แต่ไม่ใช่โหราศาสตร์อีกต่อไป.
- ไม่ deterministic. ML inference จะ produce ผลลัพธ์ที่เปลี่ยนเมื่อ retrain. Mythsensus's promise = "วันเกิดเดียวกัน → คะแนนเดียวกัน ตลอดไป" — ML breaks that.
- เรื่อง privacy. Supervised ต้องเก็บ user data centrally to train. Mythsensus engine รันใน browser ของคุณ ไม่ส่งวันเกิดออก. ML ต้อง break that architectural promise.
เลือก aesthetic parameter fitting ภายใต้ 3 internal criteria จึงเป็นทาง เดียว ที่ปลอดภัยทั้ง 4 มิติ — แต่เราไม่ปกปิดว่ามันคือ "parameter tuning" ไม่ใช่ "AI learning".
ทำไม weights ถูก freeze หลัง calibrate
ถ้า weights เปลี่ยนได้ → คะแนนของคุณวันนี้ ≠ คะแนนของคุณปีหน้า — แม้วันเกิดยังคงเดิม. นั่น break "version-locked deterministic engine" promise. เรา freeze ตั้งแต่ calibration ครั้งแรก (Apr 2026) — และจะไม่ tune จนกว่าจะมี engine v2 upgrade (Q3-Q4 2026 ที่ทำ IAU 2006 precession + precise jiéqì) ตอนนั้นจะ re-calibrate ครั้งเดียวพร้อม code change ครั้งใหญ่ และ document ใน changelog.
Mythsensus/report-engine/lib/calc.ts ที่ array ชื่อ SCORE_WEIGHTS — ทุก commit เป็น public history ใน git. Bundle เดียวกันถูกแจกผ่าน mythsensus-mcp on npm (MIT license) — ใครก็ verify ได้ว่าค่าเลขตรงกัน.
Honest disclosure · gap ที่เหลือ
Gap 1 · Dataset size unknown publicly. "หลายพันใบ AA-rated" ตอนนี้ยังไม่ publish exact count. คำนวณตอน calibration เป็น snapshot ที่ไม่ archive — ถ้าจะ reproduce ต้อง re-snapshot dataset วันนี้ซึ่งจะมี chart เพิ่มเข้ามาตั้งแต่ Apr 2026. Mitigation: ใน v2 calibration (Q3-Q4) จะ archive exact snapshot + publish count + license.
Gap 2 · Selection bias ของ AA-rated charts. AA-rated มี over-representation ของ Western European + American historical figures (สูติบัตร infrastructure). Asian/African/indigenous historical charts มีน้อยใน AA-rated — แม้ Mythsensus ใช้ 26 ศาสตร์จากทั่วโลก calibration cohort ก็ skew ตามที่มี data. Mitigation: v2 จะ supplement ด้วย AA-rated Asian collections (Hong Kong BaZi databases · Vedic Jyotish AA-rated charts) — งานวิจัย archival ที่ดำเนินอยู่.
Gap 3 · ไม่มี predictive validation. เราไม่ได้พิสูจน์ว่า "คน Mythic ทำเงินได้มากกว่า · ดวงดีจริงไหม". ไม่มี outcome variable ที่ engine optimize. เราพิสูจน์เฉพาะ internal consistency. ถ้าผู้ใช้คาดหวัง "อ่านแล้วแม่นเพราะ ML predict outcome ของฉัน" — engine ไม่ทำเช่นนั้น และไม่ควรขายว่าทำเช่นนั้น.
The reproducibility loop
ถ้าคุณเป็น engineer อยากจะ verify methodology นี้:
npx mythsensus-mcp— engine เดียวกัน, MIT-licensed, calls deterministic functions ใน CJS files- Compute Cosmic Score ของบุคคล AA-rated 50 คน (Steve Jobs · MLK · Marie Curie · Einstein · ฯลฯ) → ตรวจ distribution: median ใกล้ 500 ไหม · Mythic ≤ 1% จริงไหม
- ดูสมการ weighted-median ที่ /how-it-works#methodology — เรา explicit ว่า Cosmic Score = median ของ 25 voting systems (biorhythm excluded), ไม่ใช่ average
- ถ้าตัวเลขไม่ตรง — เปิด issue ที่ mythsensus-mcp GitHub
บทความนี้ตอบ AI audit panel feedback (5 personas · 2026-06-08) ที่ flagged "calibration methodology unspecified" เป็น HN-front-page credibility-killer. เปิดเผยตอนนี้เพราะถ้า engineer audience จะ tear apart ก็ tear apart ก่อนที่ marketing copy จะอ้างเกินจริง.