JFS

Méthodologie

Comment nous trouvons les signaux, les évaluons et les transformons en articles.

Le pipeline de contenu

  1. 1
    Collect

    RSS feeds + HTML scraping from 16 Japanese government and industry sources. robots.txt respected. Rate-limited.

  2. 2
    Extract

    Body text extracted via trafilatura (HTML) or pypdf (PDFs). Min. 200 chars to proceed.

  3. 3
    Classify

    Keyword matching against 7 categories and 16 investment themes. LLM assist for low-confidence items.

  4. 4
    Score

    7-axis scoring (0–5 each, max 35). Only items scoring ≥15 proceed.

  5. 5
    Generate

    Claude API with journalist-voice prompt. Deterministic humanize pass applied automatically.

  6. 6
    Review

    Human editor reviews draft. [VERIFY] markers block publish until resolved.

  7. 7
    Publish

    Manual publish command moves draft to published/. Translations generated for all 4 locales.

Évaluation des signaux

Seuls les signaux obtenant 15 ou plus sur 35 passent à l'étape de génération d'articles.

Pertinence pour l'investissementCe signal a-t-il un lien direct avec une décision d'investissement ou commerciale ?
Utilité pour les étrangersCette information est-elle spécifiquement utile à un lecteur non japonais ?
NouveautéEst-ce frais — pas encore couvert par la grande presse financière ?
Échelle du marchéQuelle est la taille du marché ou du budget politique concerné ?
Profondeur de nicheCela couvre-t-il un angle spécifiquement japonais ?
Potentiel SEOY a-t-il une demande de recherche démontrée pour ce sujet ?
ViralitéY a-t-il un chiffre, un classement ou un angle qui se propage ?

Génération d'articles

Les signaux qualifiés sont rédigés à l'aide d'une invite API Claude personnalisée conçue autour de la voix journalistique. Une passe de post-traitement déterministe remplace ensuite toutes les phrases typiques de l'IA restantes en utilisant une liste organisée de plus de 80 substitutions.

Révision humaine

Chaque brouillon est enregistré dans un répertoire de mise en scène et examiné par un éditeur humain avant publication. Rien n'est publié automatiquement.

Traductions

Les articles en anglais sont la source faisant autorité. Les traductions en hindi, français et chinois simplifié sont générées via l'API Claude avec des instructions explicites pour préserver les noms d'entreprises, les chiffres en yen et les noms propres inchangés.