Animint

Anime & manga

Aide   Plan du Site    

Pazu
rei

Blog d'Animint

Animint est un site francophone de référence sur les dessins animés japonais et le manga. Outre ce blog, il comporte plusieurs milliers de pages de texte illustré, que nous vous invitons à découvrir.

De retour d'Anim'Est

Par Pazu le Lundi 20 novembre 2006 21:05 :: Manifestations

2006, Cosplay

Les 18 et 19 novembre derniers s'est tenue la cinquième édition de  la convention lorraine, Anim'Est, dans la ville de Nancy.

La place Stanislas

La manifestation avait lieu au palais des congrès, sur plusieurs niveaux, du sous-sol jusqu'au troisième étage. Nous avons été surpris de trouver relativement peu de fanzines présents, alors que les exposants professionnels, éditeurs ou boutiques, étaient plutôt nombreuses pour un tel événement, sans oublier le stand de dépôts/ventes.

Les stands de fanzines

Le cosplay s'est déroulé en une seule séance le samedi, en réunissant les prestations individuelles et les groupes, avec des costumes très réussis. Tous les cosplayeurs n'ont pas défilé sur scène et beaucoup déambulaient dans les espaces de la convention, remplis de monde.

Final du cosplay

Ajouter un commentaire - Discuter de ce billet sur le forum - Lien permanent

Koyo: Photos automnales

Par Pazu le Mercredi 15 novembre 2006 20:37 :: Japon

2006, Japon

A l'automne, les teintes prises par les érables japonais sont sans commune mesure avec les couleurs de nos forêts françaises. Ce sont des images caractéristiques du Japon pendant une période d'une à deux semaines à peine. Cette année, le temps est resté relativement chaud, plus longtemps que d'habitude et il a fallu se rendre en montagne pour pouvoir observer des paysages de koyo au début du mois.

Lac

Pont

Ajouter un commentaire - Discuter de ce billet sur le forum - Lien permanent

Mai-Otome Zwei

Par Pazu le Dimanche 12 novembre 2006 18:37 :: Découvertes

Série, 2004, 2005, 2006, 2007, Japon, OAV

La toute première série de 2004, Mai-HIME, a connu un succès suffisant pour donner naissance à un spin-off en  2005, avec Mai-Otome.  Les deux séries produites par la Sunrise, le studio d'animation plutôt spécialisé dans les histoires de mecha,  font toutes les deux vingt six épisodes et ont été réalisées par  Masakazu Obara , avec  Hirokazu Hisayuki au character design , sur des musiques de Yuji Kajira. Toute l'équipe a été reconduite pour travailler sur un nouvel opus, qui prend la forme de quatre OAVs, Mai-Otome Zwei.

L'histoire se déroule peu après la fin de la série. Dans un royaume redevenu paisible, Mashiro fait le maximum pour se comporter comme une bonne reine, tandis que Arika Yumeria suit encore des cours pour pouvoir achever son cycle d'étude à l'école Garderobe.  Leurs projets sont hélas interrompus par une grande catastrophe: Une météorite  tombe sur la planète! Toutes les Otome  sont appelées au secours.

La date de sortie du premier volume, au Japon, est fixée au 24 novembre et s'intitule Yume no Tsuzuki  (La poursuite du rêve). Le site officiel japonais est accessible à l'adresse http://www.my-zhime.net

Mai Otome Zwei

Commentaires(3) - Discuter de ce billet sur le forum - Lien permanent

Premières impressions sur les séries de l'automne

Par Pazu le Jeudi 02 novembre 2006 20:40 :: Découvertes

Série, 2006, Japon, Evangelion, Fullmetal Alchemist

Parmi la multitude de nouvelles séries parues au Japon cet automne, quelques titres attirent l'attention:

- Dead Note: Nous sommes loin d'un titre d'action, même si les morts surviennent à tout va. Le côté fantastique est assez limité voir pauvre par rapport à d'autres anime mais l'ambiance est bien glauque et le décors est bien posé pour avoir un bon duel entre les deux protagonistes, Light et le mystérieux L.

- Code Geass: Avoir un design original de CLAMP n'est guère enchanteur, avec des personnages longilignes à l'extrême. Excepté le personnage de Lelouch, les traits des visages ne sont pas trop caractéristiques des mangaka.  Quant à l'histoire, la position de départ est assez rocambolesque avec l'apparition d'un empire Britannia qui écrase le monde et asservit ses habitants. Nous retrouvons des  situations à la Gundam, avec des amis d'enfance de part et d'autre des deux camps, chacun étant un champion. C'est visiblement la mode de ne pas faire dans la dentelle et nous avons droit à de belles scènes de massacres en règle, dès le premier épisode. En parallèle, le héros ne se contente pas de savoir manier un robot mais à un pouvoir surnaturel. Cela varie un peu d'un sempiternel anime de mecha.

- D-Gray: Là, sans à cause du character design et de l'ambiance, nous avons l'impression d'avoir affaire à un clone de Fullmetal Alchemist, de la même façon que nous avons une foule de séries qui ont essayé de jouer sur le phénomène Evangelion, dans le passé.  Allen Walker ressemble quand même beaucoup à Edward Elric, même si l'est un est chasseur de démons tandis que l'autre est alchimiste.

- Ghost Hunt: Difficile de se faire une opinion rien qu'au début de la série. La situation est  plutôt incongrue avec l'embauche forcée de Mai par Kazua, et une arrivée de  tout un tas de spécialistes de fantômes. Le design est sympa mais l'intrigue laisse à désirer.

- Asatte no Hôkô: Du genre shôjô et original, avec la permutation de l'âge des deux filles et, en toile de fond, le passé  trouble  du frère et de l'ancien amant.  Là aussi un design sympa et une histoire qui va à son rythme, agréablement.

Code Geass

Commentaire(1) - Discuter de ce billet sur le forum - Lien permanent

Tsubasa Chronicle

Par Pazu le Jeudi 26 octobre 2006 20:39 :: Découvertes

Film, Série, 2005, 2006, 2007, Manga

La série télévisée est l'adaptation du manga éponyme du groupe CLAMP et sa deuxième saison se termine le 4 novembre prochain, au 52ème épisode.  L'histoire narre le voyage inter dimensionnel de Sayoran et de Sakura, qui doit retrouver les fragments de sa mémoire sous forme de plumes. Ils sont acompagnés dans leur quête par un puissant guerrier, Kurugane, et d'un mage, Fai, sans oublier le petit Mokona, qui leur permet d'effectuer les sauts entre les mondes parallèles.  Leurs aventures sont l'occasion d'effectuer quelques cross-over entre les différents univers de CLAMP.

Une troisième saison est déjà annoncée pour avril 2007. Après un premier film en 2005, le titre a encore de beaux jours devant lui et fait partie des bockbusters en terme de goodies. En voici un exemple ci-dessous, qui ressemble à un mini album photos, au premier abord.

Tsubasa Chronicle

C'est sans compter sur la manie japonaise de mettre plusieurs couches d'emballages. Il ne s'agit en fait que d'un simple jeu de cartes, après dépouillage.

Cartes Tsubasa Chronicle

Commentaire(1) - Discuter de ce billet sur le forum - Lien permanent

Le calendrier Ghibli 2007 est arrivé...

Par Pazu le Mercredi 18 octobre 2006 20:09 :: Divers

Studio Ghibli, Takahata, 2006, 2007, Nausicaä

...chez moi.

Calendrier Ghibli 2007

L'édition 2007 du calendrier des célèbres studios Ghibli où officient encore Miyazaki, père et fils, ainsi que Takahata comporte différentes images, issues des nombreuses réalisations, de Nausicaä à Gedo Senki. Vous ne trouverez pas d'inédits cette année mais il y a une quinzaine d'illustrations en tout. Les feuilles de chacune d'entre elles sont indépendantes des pages pour les mois.

Un petit mot sur la boutique en ligne d'où provient le calendrier. Je suis passé par YesAsia.com, bien fourni en la matière. La société  a un entrepôt en Allemagne, d'où a été expédié le colis vers la France. L'ensemble de ma commande, dont le calendrier faisait partie, a été envoyé le 9 octobre, puis le tout  est arrivé le 18 octobre, sans problème.  Dans l'absolu, les prix sont élévés mais ils incluent le coût du transport. En comparant avec d'autres concurrents,  ils étaient les moins chers pour les articles que je cherchais, lorsque vous cumulez le prix au détail et les frais de port.

Gedo Senki

Commentaire(1) - Discuter de ce billet sur le forum - Lien permanent

La mélancolie d'Haruhi Suzumiya

Par Pazu le Samedi 07 octobre 2006 13:15 :: Découvertes

Série, 2006, 2007, Manga

Après l'Animage de septembre, qui était encore une fois focalisé sur Gudam Seed, le numéro d'octobre propose, lui, un grand poster pot pourri de la Mélancolie d'Haruhi Suzumiya.

Cette série est plutôt atypique avec une lycéenne très spéciale comme personnage centrale. Haruhi Suzumiya monte un club, qui est à la recherche de phénomènes paranormaux et qui est également à  la botte de sa présidente et fondatrice.  Mis à part Kyon, le seul garçon à peu près raisonnable, les autres membres sont plus ou moins spéciaux. Vous verrez qu'ils sont bizarres à juste titre, si vous suivez l'intrigue de cette série de quatorze épisodes.

Ces épisodes ont été diffusés dans le désordre par rapport à la chronologie de l'histoire. Il est classique d'avoir un premier épisode pilote, qui permet d'accrocher les spéctateurs plus facilement. Ici, le premier épisode correspond en fait au onzième. Dans les Chroniques de la guerre de Lodoss, le premier  chapitre est également  un moment qui intervient plus loin dans la quête des héros. En revanche, la mélancolie d'Haruhi Suzumiya va plus loin en mélangeant complètement les étapes. Le dernier épisode devrait être, par exemple,  le sixième, chronologiquement.

Outre le côté burlesque propre à l'anime, avec les enjeux mondiaux et les différents personnages, le titre fait quelques clins d'oeil, ça et là, à d'autres anime ou jeux vidéos. Vous reconnaîtrez ainsi le générique de Touch en musique de fond pendant une partie de base ball, et vous verrez encore un robot  Gundam apparaître.

Melancolie d'Haruhi Suzumiya

Commentaires(6) - Discuter de ce billet sur le forum - Lien permanent

Goodies Ouran Koukou Host Club

Par Pazu le Samedi 30 septembre 2006 23:06 :: Découvertes

Série, 2006, Fullmetal Alchemist, Manga

Comme d'autres magazines japonais spécialisés, Animage propose des goodies dans ses numéros, que ce soient des posters ou même des DVDs. De temps à autres, vous trouverez des objets plus inattendus comme une trousse Gundam Seed, un T-shirt Di-Gi-Charat ou les gants blancs de Fullmutal Alchemist

Le numéro du mois d'août 2006 contenait une toile cirée, aux couleurs d'Ouran Koukou Host Club, une série de vingt six  épisodes, qui vient de s'achever  le 26 septembre.

Dans Ouran Koukou Host Club, Haruhi Fujioka, malgré son apparence de garçon, est une jeune fille qui poursuit ses études dans un lycée privé de haut standing, Ouran Gakuen.  Boursière, elle n'est pas du même milieu que les autres élèves et a tout juste de quoi vivre. Au lycée, elle brise accidentellement un vase d'une valeur de huit million de yens dans la salle du Ouran Host Club, et elle  rentre  dans le cercle pour  s'occuper des tâches les plus ingrates, pour pouvoir rembourser sa dette.

Ce club est très spécial : il regroupe six garçons stars du Ouran Gakuen, qui font tourner les têtes des filles. Haruhi devient membre du club mais les autres la prenne d'abord pour un garçon. Affublée avec avec un uniforme masculin du club, elle a beaucoup plus d'influence que lorsqu'elle est simple élève.  D'où de beaux quipropos et un bon nombre de situations cocasses.

L'anime est une adpatation du manga éponyme de Bisco Hatori, dont les premiers tomes sont parus en France.

Ouran High School Host Club

Ajouter un commentaire - Discuter de ce billet sur le forum - Lien permanent

Harakuju 2006 à Bercy

Par Pazu le Dimanche 17 septembre 2006 16:41 :: Manifestations

2006, Cosplay

Le festival Delcourt 2006 a été l'occasion d'une nouvelle édition Harakuju, avec les stands de fanzines dans le parc de Bercy et des défilés de cosplay et des jeux, à côté du pont.  Les photos ci-dessous date du dimanche 17 septembre. Un défilé libre de cosplay a eu lieu le samedi, avec quelques participants.  Un autre événement, le salon du jeu a eu lieu le même week end, avec également du cosplay.

Stands
Quelques stands dans les allées du parc, non loin des dédicaces des auteurs de BDs européennes.

Concurrente
Vue de dos d'une des concurrentes individuelles avec un très joli costume, sous toutes les coutures.

Individuels
Regroupement à la fin du défilé des individuels, sous un ciel couvert.

Groupes
Photo de fin sur le pont, après le défilé des groupes.

Ajouter un commentaire - Discuter de ce billet sur le forum - Lien permanent

Filtre naïf de Bayes en Php

Par Pazu le Dimanche 20 août 2006 15:08 :: Webmastering

2006, Webmaster, Manga

Notre problématique

Notre annuaire de sites francophones  présente toujours un petit souci au niveau des inscriptions via le formulaire de soumission. De plus en plus d’outils automatiques de soumission permettent à un webmestre lambda d’inscrire son site à une flopée d’annuaires, sans s’occuper de savoir si son inscription est pertinente ou pas. Ce n’est pas ce genre d’outils qui améliore le référencement, et même au contraire, cela peut pourrir vos scores si vous inscrivez votre site dans un mauvais annuaire. La problématique du référencement pourra faire l’objet d’un autre billet mais ce n’est pas le sujet abordé ici.

En pratique, nous nous retrouvons avec des soumissions aussi rocambolesques que de la charcuterie auvergnate trucmuche ou que de l’agence marocaine de voyages bidule. Autant d’entrées qui finissent directement au panier mais qui sont casse-pieds à traiter à la longue, étant donnée que nous effectuons une vérification manuelle pour valider chaque site.

Les stratégies possibles

Diverses stratégies s’offrent à nous pour palier au problème. La première est de bloquer les inscriptions automatiques en travaillant sur le formulaire proprement dit. Pendant une période, nous avons ajouté une image dont il fallait copier les caractères affichés dans un champ pour valider le formulaire. Nous pouvions aussi user du code javascript pour transformer le formulaire en un item estampillé Web 2.0 très à la mode. D’un autre côté, ces actions ne vont pas dans le sens d’un site privilégiant l’accessibilité et freinent les utilisateurs dont nous attendons les sites web. De plus, les agents de soumission automatique sont de plus en plus intelligents et rien ne garantie que ces obstacles restent longtemps efficaces. Sur ce point, le formulaire a été retravaillé pour freiner les robots basiques de soumission tout en restant transparent pour un utilisateur humain, sans qu’il ait une contrainte au niveau de l’activation du Javascript et des cookies dans son navigateur web.

En fait, nous nous sommes plutôt penchés sur le vrai problème, que le site soit soumis par un humain ou par un programme, c’est-à-dire rejeter les entrées hors sujets, donc plutôt à s’intéresser au contenu soumis qu’à la façon dont il est soumis. La solution consiste à ajouter un filtre anti-spam, de la même façon qu’il en existe pour le courrier électronique. Un outil comme spam-assassin, largement utilisé et reconnu pour son efficacité, s’appuie en gros sur deux types d’algorithme : Le premier gère des règles précises concernant le format du mail, les entêtes, l’encodage utilisé, etc. De là découle une première note pour le mail traité. Le second type de traitement, basé sur le théorème de Bayes, calcule la probabilité que le contenu du mail soit un spam, proprement dit. Le savant dosage des deux méthodes aboutit à déterminer si le mail est oui ou non un spam. Un tel outil n’est pas directement adaptable sur notre problème de soumission de liens. Tout d’abord pour des questions techniques mais également pour des questions logiques :   A supposer que nous arrivons à définir des règles quant à la validité d’une inscription, elles n’ont rien à voir avec celles gouvernant la bonne syntaxe d’un mail électronique. De même, il y a spam et spam. Spam assassin aura une approche neutre quant à un mail en anglais tandis que nous, nous rejetons une soumission en anglais dans 100% des cas, vue que notre site est francophone. Par ailleurs, nous recensons les boutiques de vente en ligne de manga alors que dans un mail, un message commercial a de fortes chances d’être rejeté. Ici, ce ne sera pas forcément le cas. La base de connaissance ne peut pas être la même.

Cette base de connaissance est basée sur des mots. Dans le passé, les filtres se focalisaient sur des listes blanches et noires, qui suivant la liste où le mot d’un texte était trouvé, le texte était estampillé bon ou spam. Cette approche est très réductrice même si elle peut être un bon complément dans notre cas. Si nous sommes quasiment sûrs de rejeter une entrée avec le mot hardcore, il n’en est pas de même avec le mot boutique : boutique manga aura des chances de passer, contrairement à boutique de lingerie. Il faut raisonner en terme de probabilités. Le filtre s’appuie en fait sur la probabilité pour qu’un mot fasse partie du vocabulaire de spam ou non spam pour en déduire la probabilité du texte en entier quant à son statut de spam ou non spam.

Ed de Cowboy Bebop

Les équations

C’est là où le théorème de Bayes intervient : Il nous dit que la probabilité d’avoir du spam quand nous voyons les mots M1, M2, M3, etc. est égale à la probabilité d’observer du spam dans l’absolu multiplié par la probabilité de voir les mots M1, M2, M3, etc.  dans un texte de spam, le tout divisé par la probabilité de voir les mots M1, M2, M3 dans un texte, quoiqu’il soit.

P(S | M1, M2, M3, …) = P (S) * P (M1, M2, M3, … | S) / P (M1, M2, M3, …)

Nous considérons que les probabilités pour chaque mot, qu’il fasse partie du vocabulaire spam, lorsque nous les observons dans la nature, sont décorellées. Ceci est faux dans l’absolu, étant donnée la richesse de notre langue et les associations de mots, mais cela nous permet d’écrire, avec cette vision naïve :

P (M1, M2, M3, …| S) = P (M1 | S) * P (M2 | S) * P (M3 | S) …
P (M1, M2, M3, …) = P (M1) * P (M2) * P (M3) …

C’est-à-dire que la probabilité de voir apparaître les mots M1, M2, M3 dans un spam, ou dans texte, est égale au produit de la probabilité de chacun de ces mots dans un spam, ou respectivement, dans un texte. Nous notons désormais P (S | D) = P (S | M1, M2, M3, …), M1, M2, M3, … constituant le document D à traiter.

Du coup, la formule devient
P (S | D) = (P (S) * P (M1 | S) * P (M2 | S) * P (M3 | S) …) / (P (M1) * P (M2) * P (M3) …)

Suivant le même principe, nous pouvons remplacer la classe spam, S, par la classe non spam, NS, dans la formule.

P (NS | D) = (P (NS) * P (M1 | NS) * P (M2 | NS) * P (M3 | NS) …)  / (P (M1) * P (M2) * P (M3) …)

Le dénominateur Z = (P (M1) * P (M2) * P (M3) …) est commun aux deux formules et n’a donc pas d’incidence sur la probabilité qu’un texte avec les mots M1, M2, M3,.. soit un spam ou un non spam. L’enlever nous fait juste perdre un coefficient de normalisation de la valeur de P (NS | D) et de P (S | D).

De toute façon, en passant Z à gauche des équations, nous obtenons

Z =  (P (NS) * P (M1 | NS) * P (M2 | NS) * P (M3 | NS) …)  / P (NS | D) = (P (S) * P (M1 | S) * P (M2 | S) * P (M3 | S) …) / P (S | D)

D’où

P (NS | D) / P (S | D) = (P (NS) * P (M1 | NS) * P (M2 | NS) * P (M3 | NS) …) / (P (S) * P (M1 | S) * P (M2 | S) * P (M3 | S) …)

Les probabilités sont des nombres inférieurs à 1, voire beaucoup inférieur à 1. Si le nombre de mots est élevé, les multiplications ci-dessous peuvent rapidement devenir un problème de traitement au niveau de la machine, qui est limitée en terme de précision. Il est donc judicieux de passer à l’usage du logarithme népérien qui adoucit la profondeur des calculs.

Ln (P (NS | D) / P (N | D)) = Ln (P (NS) / P (S)) + Ln (P (M1 | NS) / P (M1 | S)) + Ln  (P (M2 | NS) / P (M2 | S)) + (P (M3 | NS) / P (M3 | S)) + …

Un document D est un spam si bien entendu

P (NS | D) < P (N | D) 

Donc si :

P (NS | D) / P (N | D) < 1.

Ce qui donne avec le logarithme népérien :

Ln (P (NS | D) / P (N | D)) < 0

Soit finalement si:

Ln (P (NS) / P (S)) + Ln (P (M1 | NS) / P (M1 | S)) + Ln (P (M2 | NS) / P (M2 | S)) + (P (M3 | NS) / P (M3 | S)) + … < 0

L’apprentissage

L’équation obtenue n’a d’utilité que si nous connaissons les valeurs de P (NS),  P(S),  P (M1 | NS), P(M2 | NS), P(M3 | NS), …, P(M1 | S), P(M2 | S), P(M3 | S), …etc.

Ces valeurs sont obtenues par apprentissage. En langage de probabilité, nous faisons des tirages et en déduisons les valeurs suite à l’observation. Pour revenir à quelque chose de moins théorique, l’apprentissage du spam et no spam, par un système, peut être simple.

Nous lui soumettons différents documents en lui signalant s’il s’agit d’un texte que nous classerions spam ou non spam. Il calcule le nombre d’occurrences pour chaque mot, pour chaque classe, spam et non spam, et il en déduit les probabilités d’avoir du spam, d’avoir du non spam, et pour chaque mot, la probabilité qu’un mot soit vu dans un spam ou dans un non spam.

Il faut une base solide pour que les valeurs soient significative et que vous ne preniez pas comme source, des probabilités marginales. Si mes souvenirs sont bons, en pratique, un filtre anti spam pour mail s’appuie sur quatre mille messages.  Cependant, l’apprentissage et l’observation sont imparfaits. Il est peu vraisemblable d’ailleurs que vous puissiez fournir l’intégralité des mots en apprentissage au système. Si un mot est complètement inconnu, il n’est pas pris en compte pour l’équation. Cependant, vous rencontrerez les cas où vous aurez une probabilité pour un mot en classe spam, mais pas en classe non spam, ou bien l’inverse. Supposons que le mot Martinique a été trouvé parmi les spam mais que nous n’avons pas d’occurrence dans les non spam. P (Martinique | NS) = 0 et P (Martinique | S) = 1 dans ce cas. Dans l’absolu, c’est faux, car il se peut qu’il y ait un site manga qui aurait le mot Martinique dans sa description, par exemple. P (Martinique | NS) = 0 vient d’une observation imparfaite et vient plomber notre équation en donnant une valeur moins l'infini, faisant fi des autres facteurs qui auraient pu tirer la valeur dans un sens ou dans l’autre.

Ce qui est sûr en revanche, c’est que P (Martinique | NS) est faible, en tout cas plus faible que les probabilités observées. Dans l’équation, P (Martinique | NS) devient ainsi non nulle. C’est ce que nous appelons dans le jargon, un lissage de Laplace.

L'implémentation en PHP

Il existe quelques exemples sur le net de codage de filtre utilisant l’application naïve du théorème de Bayes. Dans notre cas, nous nous sommes limités à deux classes, spam et non spam mais nous pouvons avoir des applications avec plusieurs classes. Cela a l’inconvénient de compliquer les explications et de nous éloigner de notre but initial, qui est d'effectuer un choix binaire. Des recherches sur les mots clefs naive bayes theorem ou encore bayesian classifier devraient vous rapporter un bon nombre d’explications, généralement en anglais, hélas pour vous, si vous êtes anglophobe.

Un exemple intéressant pour débuter est celui trouvé en français sur le blog d’XHTML.net. Au-delà  du codage des boucles de calcul, son auteur propose une implémentation complète avec formulaire et base de données derrière, avec une approche objet quant à la conception du code concernant les filtres bayesiens.

Mes quelques remarques

En ce qui concerne le code fourni sur XHTML.net

-    Le code est un exercice complet donc comporte une partie de connexion et de gestion de la base de données. Si vous avez déjà une couche d’abstraction pour votre base de données, quelques retouches sont nécessaires.

-    Le filtre prévoit l’utilisation d’une liste de mots à ignorer et ce, à juste titre. Un mot comme ‘site’ dans notre cas, n’a aucune incidence sur la décision de spam ou non spam. Autant ne pas en tenir compte avent de polluer notre base de connaissance avec. L’implémentation se limite à une insertion en dur dans le code, d’un tableau de mot. Il vous faudra coder la gestion de cette liste par la base de données. Rien de bien méchant.

-    Les calculs des probabilités s’effectuent directement en produit, au lieu d’utiliser les logarithmes népériens. Même si une valeur est mise en facteur pour éviter les dépassements de précision, celle-ci n’est pas adaptée dès que vous avez plusieurs mots. Le mieux est sans doute d’insérer des fonctions log, qui transforment ensuite vos produits en sommes et vous donnent une réserve en terme de calculs.

-    P(S)  est déduite dans le code en faisant le rapport du nombre d’occurrence de mots trouvés en spam par le nombre total d’occurrences des mots. Elle n’est pas déduite du rapport du nombre de documents spam par le nombre total de documents.

-    L’outil prend en compte dans les calculs les probabilités d’un mot même s’il n’a été rencontré qu’une fois. Même avec le coefficient de lissage de Laplace, les probabilités sont faussées. Dans notre version pour les liens, nous n’en tenons compte que si le mot a plusieurs occurrences.

-    J’ai des doutes sur la valeur du coefficient choisi pour le lissage de Laplace. Un autre document sur le net proposait une valeur précise, mais visiblement empirique. Il faudrait le retrouver.

Urd et Skuld devant un ordinateur

Ajouter un commentaire - Discuter de ce billet sur le forum - Lien permanent

22-07-08 23:25 nana : coucou

20-07-08 14:53 nour : slt les manga je vous addors et je cherche à des nouvelles tofs ou vedeo de votre dessins annimées

15-07-08 15:39 Magda : Woaa vrément trop cool

31-05-08 22:37 bb king : c qd que vous nous filer les résultats de lanime rgand prix numéro 30?

31-03-08 22:13 Axou : mmmh du hentai ??? mdr

02-02-08 20:35 connexion12 : merci a tous laisser moi des commentaire

08-12-07 12:10 malick : je voudrai recevoir ce jeu hokuto

08-10-07 15:19 yaya : ta note" L'anime pour fan blasé" mdr
t'arrêtes de me décrire hein :p


29-08-07 18:34 Pazu : Ai no melody - la mélodie de l'amour, d'après le CD de la B.O. sorti en France.

29-08-07 14:26 jessica : J'aurai voulu savoir si vous saviez quel était le titre de la musique de fin du film Origine.

17-06-07 11:45 Pazu : Dans les librairies de BDs d'occasion (boulier, etc...) mais il y a peu de choix. Les depots ventes des conv sont mieux.

11-06-07 21:39 Amélie : Est-ce que qqun sait ou on peut trouver des mangas d'occasion à Paris?

09-06-07 14:31 Freddie : Y a plein de manga ici!

07-06-07 21:02 Pazu : Je vais essayer de décorreler la shoutbox des commentaires billet mais faur arrêter d'être bavare comme ça :)

06-06-07 21:08 Diyo : Impossible de laisser des commentaires sur le blog. Soit ils sont trop longs (et pourtant...), soit ils font référence à un site web (et pourtant)... C'est un peu strict... Bref, j'abandonne...

05-06-07 18:56 Pazu : Tous les liens sont désactivés dans les commentaires à cause des méchants robots spammeurs.

03-06-07 14:40 sed : bouh on ne peut pas mettre de trailers dans les commentaires ?? ben en tout cas skull man àl'air d'etre bien niveau graphisme ambiance rien qu'en visionnant les trailers :p quelqu'un à zyeuté les episodes ??

15-05-07 20:43 Pazu : J'ignore s'il y a site plus mondial à ce sujet là - Nous ne faisons déjà pas la Belgique ni la Suisse...

15-05-07 14:43 sanaa : salut a tous je veus savoir des infos s'il y a moyen de penser a vos fanes au MAROC et s'il aura une manifestation de japanimation.

12-04-07 17:25 Pazu : Vous avez la rubrique actualités du site pour voir les prochaines dates des conventions des mois à venir.

12-04-07 10:39 aymeric : je souhaites connaitre la prochaine exposition qui se tiendras dans le nord a vous lire merci

08-04-07 21:17 yoh : yeah le retour de la shout

02-04-07 15:32 0410yuna : Bonjour a tous! Je cherche des infos pour savoir quand aura lieu la prochaine manisfestation de japanimation sur lyon. Si quelqu'un a des renseignements merci de m'avertir.

17-03-07 16:31 Eichina : moi suis trop fan de shonen ai (ah ah ah) genre Kyo kara maou Gravitation, Loveless

01-03-07 00:09 Le+Mamelouk : Mon budget mangas a encore augmenté T_T
Faut que j'arrête de m'informer :p


28-02-07 23:34 Pazu : Chouette des lecteurs. Merci pour les compliments. Taifu a bien fait de nous envoyer ses nouveautés :P

28-02-07 21:19 Dromar : Merveilleuse idée en effet ^^
C'est un plaisir de lire tes critiques, particulièrement ces derniers temps.


28-02-07 20:41 Le Mamelouk : Merveilleuse idée que de nous faire découvrir des mangas peu connus ! :)

24-02-07 22:35 Marie-Pier Brien : Des Animes Manga

23-02-07 21:14 Makimimi : Vive le manga

Votre nom:

Votre email:


Tags
1995 1996 1999 2000 2001 2002 2003 2004 2005 2006 Série Film OAV Manga Paris Japon Strasbourg Orléans Novice Expert Culture Webmaster Dessin Fullmetal Alchemist Nausicaä Dragon Ball Naruto Miyazaki Toei Studio Pierrot

anime manga Aggregator Sama
anime manga Animint
rss
Valid XHTML 1.0 Strict
Blogchan

Ajouter un Site - Moteur de Recherche - Nous Contacter - Accessibilité - Confidentialité - A propos