Pourquoi ArrowModel?

Evaluation Agile par Score



Pourquoi ArrowModel?



Pourquoi construire des modèles statistiques?

Le monde économique est concurrentiel. Vous êtes libre de chercher ou pas à optimiser votre activité, mais si vos concurrents le font, ils risquent de vous surpasser. De fait, la plupart des sociétés qui en ont les moyens développent ce type d’approche pour résoudre leurs principaux problèmes. Ces problèmes ne sont jamais exactement les mêmes, si bien que vous êtes forcé de développer des modèles sur mesure qui correspondent à vos données et à vos questions. Et comme votre environnement change continuellement, il faut aussi que vos modèles soient mis à jour régulièrement.

Pourquoi ArrowModel?

Il y a beaucoup de façons de faire du scoring. Nous avons recensé ci-dessous les méthodes que nous avons rencontrées ces 20 dernières années chez nos clients (surtout des Fortune 500).

Première Famille: les logiciels statistiques à tout faire

Le cas le plus courant consiste à utiliser un logiciel statistique à tout faire tel que SAS/STAT, SPSS ou R, souvent avec des macros pour automatiser le travail répétitif.

Bien que puissante et flexible, cette approche est chronophage, exige des compétences pointues, et s'adapte mal à l’évolution de vos problématiques. Quand à comprendre les modèles d'un collègue (ou même vos propres modèles, créés il y a quelques mois), cela devient vite ardu compte tenu du nombre de macros, et de données disseminées un peu partout.

Contrairement à cela, ArrowModel maintient tout ce qui est lié à un modèle dans un seul fichier, ce qui donne une structure uniforme à tous vos projets. À la différence de R, ArrowModel n'exige pas que toutes les données soient en mémoire vive, et peut travailler avec de grands volumes de données limités uniquement par votre disque dur et votre mémoire vive.

Avec ArrowModel, on peut faire un scoring sans écrire une seule ligne de code. Si vous devez transformer vos données, vous pouvez le faire en SQL dont la connaissance est plus répandue.

Deuxième Famille: les "usines à gaz"

Les solutions onéreuses comme "KXEN Analytic Framework", "Intelligent Results PREDIGY Platform" ou "SAS Entreprise Miner" visent principalement de grandes sociétés. Leur architecture en serveur/client exige qu'une infrastructure importante soit en place et fonctionne bien.

ArrowModel ne fait qu'une seule chose, mais la fait bien. Nous avons beaucoup réfléchi avant de décider ce qu'il fallait ne pas inclure. ArrowModel est construit autour d'une régression logistique et n'inclut pas la "technique du jour" comme les machines à vecteur de support (SVM), les forêts aléatoires (random forests), ou les réseaux neuronaux (neural networks).

L'interface utilisateur d'ArrowModel permet d’ affiner le modèle plutôt que d'essayer toutes les techniques disponibles. Selon Frank Harrell, "un modèle inadéquat soigneusement ajusté est meilleur qu'un modèle bien-choisi mais mal ajusté" [1]. De plus dans une majorité de cas de scoring, la régression logistique est aussi bonne, sinon meilleure, que les autres techniques [2].

ArrowModel fonctionne sur votre ordinateur de bureau et n'exige pas un raccordement Internet/Intranet. Dès que les données brutes sont sur votre poste de travail (ou sont visibles à partir de votre poste de travail), vous pouvez commencer.

Troisième Famille: les solutions "maison"

Les solutions "maison" sont plutôt rares. A moins que l'évaluation par score soit la spécialité de l'entreprise, de telles solutions consistent la plupart du temps en une mosaïque de bases de données Access, de tableurs Excel, de composantes en VBA, et de "scripts" qui marchent plus ou moins bien ensemble.

ArrowModel est écrit en C++, en utilisant des outils et des techniques modernes de développement de logiciels. Il est bien plus performant que les logiciels "maison," souvent écrits en langues interprétées. Il fonctionne sur toutes les plateformes courantes. Et en tant que produit commercial, ArrowModel est soumis à des essais très complets.

Conclusion

Comme vous le voyez, la plupart du temps, ArrowModel vous permettra de gérer tous les aspects de vos modèles plus facilement et plus rapidement qu'avec les autres solutions. Allons voir une démo d'ArrowModel...

Références

[1] Frank E. Harrell, Jr. Regression Modeling Strategies. Springer, 2001

[2] Paul Komarek. Logistic regression for fast, accurate, and parameter free data mining.