Methodology

Nguồn dữ liệu

Dữ liệu aria, opera, và composer được truy vấn trực tiếp từ Wikidata qua SPARQL endpoint công cộng (query.wikidata.org). Wikidata được cộng đồng biên tập, chia sẻ theo giấy phép CC0 — toàn bộ trường dữ liệu có thể tái sử dụng.

Truy vấn SPARQL

Operas được lọc bằng P7937 = Q1344 (form of creative work = opera). Arias được lấy qua P527 (has part) từ các opera. Composer được lấy qua P86. Ngôn ngữ lấy qua P407, năm công diễn qua P571.

Quy trình xử lý

  1. Tải CSV từ Wikidata SPARQL — 326 opera, 78 aria raw.
  2. Dedupe aria theo Q-ID (loại bỏ duplicate do performer variant) → 62 aria unique.
  3. Import vào bảng MySQL riêng (không ảnh hưởng core WordPress tables).
  4. Sinh post WordPress qua WP-CLI với conditional rendering — chỉ render H3 khi có data.
  5. Schema.org MusicComposition inject vào JSON-LD head cho aria, opera; Person cho composer.

Cập nhật

Dữ liệu opera vĩnh viễn không đổi (composer lớn đều đã mất). Khi Wikidata bổ sung aria/opera mới hoặc sửa tên, chúng tôi chạy đồng bộ theo lịch tuần để kho luôn khớp.