Equipe Raisonnement Induction Statistique

ERIcaneus europeanuS
Publications



1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
     Résumés     
Abstracts

Lecoutre M.-P. (1982) - Comportement des chercheurs dans des situations conflictuelles d'analyse des données expérimentales. Psychologie Française, 27, 1-8.
Lecoutre M.-P. (1983) - La démarche du chercheur en psychologie dans des situations d'analyse statistique de données expérimentales. Journal de Psychologie Normale et Pathologique, 3, 275-295.
Denhière G., Lecoutre B. (1983) - Mémorisation de récits: Reconnaissance immédiate et différée d'énoncés par des enfants de 7, 8 et 10 ans. L'Année Psychologique, 83, 345-376.
Lecoutre B. (1983) - Introduction à l'Analyse Bayésienne des Comparaisons (extension bayésienne de l'analyse de la variance). Cahiers d'Anthropologie et Biométrie Humaine, 1, 47-93.
Rouanet H., Lecoutre B. (1983) - Specific inference in ANOVA: From significance tests to Bayesian procedures. British Journal of Mathematical and Statistical Psychology, 36, 252-268.
Lecoutre B. (1984)L'Analyse Bayésienne des Comparaisons. Lille: Presses Universitaires de Lille.
Lecoutre B. (1985a) - How to derive Bayes-fiducial conclusions from usual significance tests. Cahiers de Psychologie Cognitive, 5, 553-563.
Lecoutre B. (1985b) - Reconsideration of the F test of the analysis of variance: The semi-Bayesian significance tests. Communications in Statistics: Theory and Methods, 14, 2437-2446.
Rouanet H., Bernard J.-M., Lecoutre B. (1986) - Non-probabilistic statistical inference: A set theoretic approach. The American Statistician, 40, 60-65.
Ciancia F., Maitte M., Honoré J., Lecoutre B., Coquery J.-M. (1988) - Orientation of attention and sensory gatting: An evoked potential and RT study in cat. Experimental Neurology, 100, 274-287.
Lecoutre B. (1989) - Modèles stochastiques d'apprentissage en psychologie. In J. Delacour et J.-C. Lévy (Eds.), Systèmes à mémoire: Une approche multidisciplinaire, 29-58.
1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
Lecoutre M.-P., Durand J.-L., Cordier J. (1990) - A study of two biases in probabilistic judgments: representativeness and equiprobability. In J.-P. Caverni, J.-M. Fabre & M. Gonzales (Eds): Cognitive Biases, Elsevier Science Publihers B.V., North Holland, 563-575.
Lecoutre B. (1991) - A correction for the epsilon approximate test in repeated measures designs with two or more independent groups. Journal of Educational Statistics, 16, 371-372.
Rouanet H., Lecoutre M.-P., Bert M.-C., Lecoutre B., Bernard J.-M. (1991) - L'inférence statistique dans la démarche du chercheur. Berne, CH: Peter Lang.
Lecoutre B., Guigues J.-L., Poitevineau J. (1992) - Distribution of quadratic forms of multivariate Student variables. Applied Statistics, 41, 617-627.
Lecoutre M.-P. (1992) - Cognitive models and problem spaces in "purely" random situations. Educational Studies in Mathematics, 23, 557-568.
Lecoutre M.-P., Rouanet H. (1993) - Predictive judgments in situations of statistical analysis. Organizational Behavior and Human Decision Processes, 54, 45-56.
Lecoutre B.(1994) - Inférence statistique et raisonnement inductif. PsychologieFrançaise, 39, 141-151.
Lecoutre B.,Grouin J.-M. (1994) - De l'inférence "classique" à l'inférence bayésienne. In B. Scherrer et Y. Bogaievsky (Eds), Les statistiques et la clinique. Paris: Médicament et Santé; 105-119.
Lecoutre B., Derzko G., Grouin J.-M. (1995) - Bayesian predictive approach for inference about proportions. Statistics in Medicine, 14, 1057-1063.
1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
Grouin J.-M., Lecoutre B. (1996) - Probabilités prédictives: Un outil pour la planification des expériences. Revue de Statistique Appliquée, XLIV, 21-35.
Lecoutre B. (1996a)Traitement statistique des données expérimentales: Des pratiques traditionnelles aux pratiques bayésiennes - Avec programmes Windows par B. Lecoutre et J. Poitevineau. Paris: DECISIA Editions.
Lecoutre B. (1996b) - Au delà du test de signification ou l'inférence statistique sans tables (à la suite d'Alain Morineau). La Revue de Modulad, 17, 98-100.
Lecoutre B., Poitevineau J. (1996) - PAC, Programme d'Analyse des Comparaisons: Guide d'Utilisation et Manuel de référence.
Lecoutre B. (1997/2005) - Et si vous étiez un bayésien "qui s'ignore"? La Revue de Modulad, 18, 81-87 [traduction en espagnol: ¿Y si Usted es un bayesiano sin "saberlo"? par Pr. Ramón Alvarez, Université de Montevideo, Uruguay]. Réédition (complétée): La Revue de Modulad, 32, 92-105.
Lecoutre B. (1998) - Teaching Bayesian methods for experimental data analysis. In L. Pereira-Mendoza, L. Seu, T. Wee, W K. Wong (Eds.): Statistical Education - Expanding the Network, Proceedings ofthe fifth International Conference on Teaching of Statistics, Vooburg, Netherlands: ISI Permanent Office, Vol. 1, 239-244.
Lecoutre M.-P., Fischbein E. (1998) - Étude de l'évolution de biais probabilistes avec l'âge à partir de résultats obtenus en France et en Israël. Recherches en Didactique des Mathématiques, 18, 311-332.
Lecoutre M.-P., Rezrazi M. (1998) - Learning and transfer in isomorphic uncertainty situations: The role of the subject's cognitive activity. In L. Pereira-Mendoza, L. Seu, T. Wee, W K. Wong (Eds.): Statistical Education - Expanding the Network, Proceedings of the fifth International Conference onTeaching of Statistics, Vooburg, Netherlands: ISI Permanent Office, Vol. 3, 1105-1111.
Poitevineau J. (1998)Méthodologie de l'analyse des données expérimentales - Étude de la pratique des tests statistiques chez les chercheurs en psychologie, approches normative, prescriptive et descriptive. Thèse de doctorat de psychologie, Université de Rouen.
Poitevineau J., Lecoutre B. (1998) - Some statistical misconceptions in Chow's statistical significance [Commentary on Chow, S.L. (1996) - StatisticalSignificance: Rationale, Validity and Utility, London: Sage]. Behavioral and Brain Sciences, 21, 215.
Lecoutre B. (1999a) - Two useful distributions for Bayesian predictive procedures under normal models. Journal of Statistical Planning and Inference, 77, 93-105.
Lecoutre B. (1999b) - Beyond the significance test controversy: Prime time for Bayes? In A. Rossman and B. Chance (Eds), Bulletin of the International Statistical Institute: Proceedings of the Fifty-second Session of the International Statistical Institute, Tome 58, Book 2, 205–208.
Lecoutre M.-P., Poitevineau J., Lecoutre B. (1999) - An experimental study of the uses and misuses of null hypothesis significance tests among psychologists and statisticians. In A. Rossman and B. Chance (Eds), Bulletin of the International Statistical Institute: Proceedings of the Fifty-second Session of the International Statistical Institute, Tome 58, Book 2, 201–202.
Mabika B.(1999)Analyse bayésienne des données de survie - Application à des essais cliniques en pharmacologie. Thèse de doctorat de mathématique, Université de Rouen.
Poitevineau J. (1999) - Pratiques des tests statistiques en psychologie cognitive: L'exemple d'une année d'un journal. Cahiers du LCPE, 3, 67-87.
1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
Lecoutre B. (2000) - From significance tests to fiducial Bayesian inference. In H. Rouanet, J.-M. Bernard, M.-C. Bert, B. Lecoutre, M.-P. Lecoutre, B. Le Roux, New ways in statistical methodology: From significance tests to Bayesian inference [2nd edition, 1st edition 1998], Bern, Switzerland: Peter Lang, 123-157.
Lecoutre B., Charron C. (2000) - Bayesian procedures for prediction analysis of implication hypotheses in 2×2 contingency tables. Journal of Educational and Behavioral Statistics, 25, 185-201.
Lecoutre B., Poitevineau J. (2000) - Aller au delà des tests de signification traditionnels: Vers de nouvelles normes de publication. L'Année Psychologique, 100, 683-713.
Lecoutre B., Poitevineau J., Derzko G., Grouin J.-M. (2000) - Désirabilité et faisabilité des méthodes bayésiennes en analyse de variance: Application à des plans d'expérience complexes utilisés dans les essais cliniques. In I. Albert et B. Asselain (Eds.), Biométrie et Méthodes bayésiennes, 14, 1-23.
Lecoutre M.-P. (2000) - And... what about the researcher's point of view? In H. Rouanet, J.-M. Bernard, M.-C. Bert, B. Lecoutre, M.-P. Lecoutre, B. Le Roux, New ways instatistical methodology: From significance tests to Bayesian inference [2nd edition, 1st edition 1998], Bern, Switzerland: Peter Lang, 65-95.
Rouanet H., Bernard J.-M., Bert M.-C., Lecoutre B., Lecoutre M.-P., Le Roux B. (2000)New ways in statistical methodology: From significance tests to Bayesian inference [2nd edition, 1st edition 1998]. Bern, Switzerland: Peter Lang.
Rouanet H., Le Roux B., BernardJ.-M., Lecoutre B. (2000) - Geometric data: From euclidean clouds to Bayesian MANOVA. In H. Rouanet, J.-M. Bernard, M.-C. Bert, B. Lecoutre, M.-P. Lecoutre, B. Le Roux, New ways in statistical methodology: Fromsignificance tests to Bayesian inference [2nd edition, 1st edition 1998], Bern, Switzerland: Peter Lang, 227-254.
1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
Lecoutre B. (2001) - Bayesian predictive procedure for designing and monitoring experiments. Bayesian Methods with Applications to Science, Policy and Official Statistics, Luxembourg: Office for Official Publications of the European Communities, 301-310.
Lecoutre B., Derzko G. (2001) - Asserting the smallness of effects in ANOVA. Methods of Psychological Research, 6(1), 1-32.
Lecoutre B., Lecoutre M.-P., Grouin J.-M.(2001) - A Challenge for Statistical Instructors: Teaching Bayesian inference without discarding the "official" significance tests. In Bayesian Methods with Applications to Science, Policy and Official Statistics, Luxembourg: Office for Official Publications of the European Communities, 311-320.
Lecoutre B., Lecoutre M.-P., Poitevineau J. (2001) - Uses, abuses and misuses of significance tests in the scientific community: Won't the Bayesian choice be unavoidable? International Statistical Review, 69,399-418.
Lecoutre M.-P., Lecoutre B. (2001) - Other scientific purposes, other methodological ways [Commentary on Hertwig and Ortmann, Experimental practices in economics: A challenge for psychologists]. Behavioral and Brain Sciences, 24, 421.
Lecoutre M.-P., Lecoutre B. (2001) - Reaction on Research in statistical education: Some priority questions by Batanero, Garfield, Ottaviani, Truran. Statistical Education Research Newsletter, 2, 17‑18.
Lecoutre M.-P., Lecoutre B. (2001) - Comentarios a investigación en educación estadística: Algunas cuestiones prioritarias (Batanero, Garfield, Ottaviani, Truran). Hipótesis alternativa, 2(3), 4‑5.
Poitevineau J., Lecoutre B. (2001) - The interpretation of significance levels by psychological researchers: The.05-cliff effect may be overstated. Psychonomic Bulletin and Review, 8, 847-850.
Lecoutre B., Mabika B., Derzko G. (2002) - Assessment and monitoring in clinical trials when survival curves have distinct shapes in two groups: a Bayesian approach with Weibull modeling. Statistics in Medicine, 21, 663-674.
Poitevineau J., Lecoutre B., Lecoutre M.-P., Rovira K. (2002) - Application de la méthode des arbres de similarité additifs de Sattath et Tversky dans une tâche de catégorisation de situations d'incertitude. Cahiers du LCPE , 6, 15-28;
1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
Lecoutre B., Poitevineau J. (2003) - Inférence statistique causale sur les effets individuels: Quelques éléments de réflexion. In A. Vom Hofe, H. Chardin, J.-L. Bernaud & D. Guédon (Eds), Psychologie Différentielle: Recherches et réflexions. Rennes: Presses Universitaires de Rennes, 101-105.
Lecoutre M.-P., Poitevineau, J., Lecoutre B. (2003) - Even statisticians are not immune to misinterpretations of Null Hypothesis Significance Tests. International Journal of Psychology, 38, 37-45.
Rovira K., Lecoutre M.-P., Lecoutre B., Poitevineau J. (2003) - Interprétations intuitives du hasard et degré d'expertise en probabilité. In A. Vom Hofe, H. Chardin, J.-L. Bernaud & D. Guédon (Eds), Psychologie Différentielle: Recherches et réflexions. Rennes: Presses Universitaires de Rennes, 167-171.
Lecoutre B. (2004) - Expérimentation, inférence statistique et analyse causale. Intellectica, 38, 193-245.
Lecoutre B., Poitevineau J., Lecoutre M.-P. (2004) - Fisher: Responsible, not guilty. Discussion of D. Denis, The modern hypothesis testing hybrid: R. A. Fisher's fading Influence. Journal de la SFdS, 145, 55-62.
Poitevineau J. (2004) - L'usage des tests statistiques par les chercheurs en psychologie: Aspects normatif, descriptif et prescriptif. Mathématiques et Sciences Humaines, 167, 5-25.
Lecoutre M.-P., Clément E., Lecoutre B. (2004) - Failure to construct and transfer correct representations across probability problems. Psychological Reports, 94, 151-162.
Lecoutre, B. (2005) - Former les étudiants et les chercheurs aux méthodes bayésiennes pour l'analyse des données expérimentales. La Revue de Modulad, 33, 85-107.
Lecoutre B., ElQasyr K. (2005) - Play-the-winner rule in clinical trials: models for adaptative designs and Bayesian methods. In Jacques Janssen and Philippe Lenca (Eds.): Applied Stochastic Models and Data Analysis Conference 2005 Proceedings. Brest: ENST Bretagne, Part X. Health, 1039-1050.
Lecoutre B., Poitevineau J., Lecoutre M.-P. (2005) - Une raison pour ne pas abandonner les tests de signification de l'hypothèse nulle. La Revue de Modulad, 33, 243-248.   A reason why not to ban Null Hypothesis Significance Tests. La Revue de Modulad, 33, 249-253.
Lecoutre B., Poitevineau, J. (2005). Le logiciel "LePAC". La Revue de Modulad, 33.
1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
Bunouf P. (2006)Lois bayésiennes a priori dans un plan binomial séquentiel. Thèse de doctorat de mathématique, Université de Rouen.
Bunouf P., Lecoutre B. (2006) - Bayesian priors in sequential binomial design. Comptes Rendus de L'Académie des Sciences Paris, Série I, 343, 339–344.
Lecoutre B. (2006) - Training students and researchers in Bayesian methods for experimental data analysis. Journal of Data Science, 4, 207-232.
Lecoutre B. (2006)- Tutoriel: L'inférence bayésienne pour l'analyse des données expérimentales. La Revue de Modulad, 35, 130-219.
Lecoutre B. (2006) - Isn't everyone a Bayesian? Indian Bayesian Society News Letter, III, 3-9.
Lecoutre B. (2006) - And if you were a Bayesian without knowing it? In A. Mohammad-Djafari (Ed.), 26th Workshop on Bayesian Inference and Maximum Entropy Methods in Science and Engineering. Melville : AIP Conference Proceedings Vol. 872, 15-22.
Lecoutre B. (2006) - How to get 1-alpha confidence level from 1-2alpha confidence intervals. Submitted for publication.
Lecoutre M.-P., Rovira K., Lecoutre B., Poitevineau J. (2006) - People's intuitions about randomness and probability: An empirical study. Statistics Education Research Journal, 5(1), 20-35.
Poitevineau J., Lecoutre B. (2006) - Computing Bayesian predictive distributions: The K-square and K-prime distributions. http://hal.archives-ouvertes.fr/hal-00113705, 1-13.
Grouin J.-M., Coste M., Bunouf P., Lecoutre B. (2007) - Bayesian sample size determination in non-sequential clinical trials: Statistical aspects and some regulatory considerations. Statistics in Medicine, 26, 4914-4924.
Lecoutre B. (2007) - Another look at confidence intervals for the noncentral t distribution. Journal of Modern Applied Statistical Methods, 6(1), 107-116.
Lecoutre B., Faure S. (2007) - A note on new confidence intervals for the difference between two proportions based on an Edgeworth expansion. Journal of Statistical Planning and Inference, 137, 355-356.
Bunouf P., Lecoutre B. (2008) - On Bayesian estimators in multistage binomial designs. Journal of Statistical Planning and Inference, 138, 3915-3926.
ElQasyr K. (2008)Modélisation et analyse statistique des plans d'expérience séquentiels. Thèse de doctorat de mathématique, Université de Rouen.
Lecoutre B. (2008) - Bayesian methods for experimental data analysis. Handbook of statistics: Epidemiology and Medical Statistics (Vol 27), Amsterdam: Elsevier, 775-812.
Lecoutre B., ElQasyr K. (2008) - Adaptative designs for multi-arm clinical trials: The play-the-winner rule revisited. Communications in Statistics - Simulation and Computation, 37, 590-601.

1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
ElQasyr K., Lecoutre B. (2009) - Comparing two success rates with Play-The-Winner designs. http://hal.archives-ouvertes.fr/hal-00422985, 1-11.
Jhean-Larose S., Denhière G., Lecoutre B. (2009) - Étude développementale de l'interprétation de combinaisons conceptuelles nominales «Relation» et «Propriété». Psychologie Française, 54, 121-135.
Bunouf P., Lecoutre B. (2010) - An objective Bayesian approach to multistage hypothesis testing. Sequential Analysis, 29, 88-101.
De Cristofaro R., Lecoutre B. (2010)A new criterion for prior probabilities. Unpublished work, hal.archives ouvertes.
Lecoutre B., Derzko G., ElQasyr K. (2010) - Frequentist performance of Bayesian inference with response-adaptive designs. Statistics in Medicine, 29, 3219-3231.
Lecoutre B., Killeen P. (2010) - Replication is not coincidence: Reply to Iverson, Lee, and Wagenmakers (2009). Psychonomic Bulletin & Review, 17, 263-269.
Lecoutre B., Lecoutre M.-P., Poitevineau J. (2010) - Killeen's probability of replication and predictive probabilities: How to compute, use and interpret them. Psychological Methods, 15, 158-171.
Lecoutre B., Poitevineau J. (2010) -  The significance test controversy and the Bayesian alternative. StatProb: The Encyclopedia Sponsored by Statistics and Probability Societies, Springer.
Poitevineau J., Lecoutre B. (2010) Implementing Bayesian predictive procedures: The K-prime and K-square distributions. Computational Statistics & Data Analysis, 54, 723-730.
Rovira K., Lecoutre M.-P., Lecoutre B., Poitevineau J. (2010) - Catégorisation de situations d'incertitude et variabilité des points de vue sur le hasard. Bulletin de Psychologie, 63, 69-80.
1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016
Lecoutre B. (2011) - Significance tests: A critique. In M. Lovric (ed.), International Encyclopedia of Statistical Science, Heidelberg: Springer Science, 1323-1325.
Jhean-Larose S., Lecoutre B., Denhière G. (2011) - From production to selection of interpretations for novel conceptual combinations: A developmental approach. Acta Linguistica Hungarica, 58, 391-416.
Lecoutre B., Derzko G. (2011)Comparing performances of several response-adaptive designs in dose finding studies. Unpublished work, hal.archives ouvertes.
Lecoutre B., Poitevineau J. (2012) - New results for computing exact confidence intervals for one parameter discrete distributions. Unpublished work, hal.archives ouvertes.
Lecoutre B., Derzko G. (2014)Tester les nouveaux medicaments: Les statisticiens et la réglementation. Statistique et Société, 2, 61-67.
Lecoutre B., Poitevineau J. (2014)The Significance Test Controversy Revisited: The Fiducial Bayesian Alternative. SpringerBriefs in Statistics (ISBN: 978-3-662-44046-9).
Lecoutre B. (2016) - Pourquoi les méthodes bayésiennes sont-elles si peu utilisées dans les publications expérimentales? Les pratiques actuelles réexaminées à partir des conceptions des fondateurs de l’inférence statistique. In I. Drouet (éd) Le bayésianisme aujourd'hui: Fondements et pratiques. Paris: Editions Matériologiques, 193-219.
Lecoutre B., Poitevineau J. (2016) - New results for computing Blaker's exact confidence interval for one parameter discrete distributions. Communication in Statistics- Simulation and Computation, 45, 1041-1053.
1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016


RÉSUMÉS / ABSTRACTS

Lecoutre M.-P. (1982) - Comportement des chercheurs dans des situations conflictuelles d'analyse des données expérimentales. Psychologie Française , 27, 1-8.

   Studied the behaviors of psychologists spontaneously developed in conflictual situations of statistical data processing; what is intended is not a normative aim, but the look for coherence lines. Three usual conflicting problems (for example, a same procedure applied to an experiment and to its replicate yielding discrepant results) were presented to 27 psychologists from several laboratories; the responses were recorded as semi-directive interviews. Two main findings. First, while behaviors were well differentiated - mostly according to the weights of several criteria such as the observed results, significance tests, reference theories and so on - it was possible to infer global attitudes that are common to almost all searchers. Secondly, it appeared that the issue of data grouping is a critical one for many searchers.


Denhière G., Lecoutre B. (1983) - Mémorisation de récits: Reconnaissance immédiate et différée d'énoncés par des enfants de 7, 8 et 10 ans. L'Année Psychologique, 83, 345-376.

    [ Illustration des méthodes bayésiennes standard ] Trois groupes de 60 enfants âgés de 7, 8 et 10 and ont été soumis à une expérience de reconnaissance immédiate et différée (une semaine) d'énoncés appartenant à des récits, et de distracteurs sémantiquement proches et lointains. L'expérience tentait de répondre à quatre questions: 1. Constate-t-on un "effet de niveau" en reconnaissance comme en rappel? 2. Observe-t-on un effet de l'âge comparable à celui obtenu en rappel ? 3. L'information est-elle stockée sous forme lexicale et/ou conceptuelle? 4. Des récits différents par leur contenu conduisent-ils à des performances différentes? L'analyse bayésienne des comparaisons (extension bayésienne de l'analyse de la variance) permet de répondre négativement aux question 1, 2 et 4. L'absence d'effet de niveau en reconnaissance immédiate et différée et les faibles différences de performance en fonction de l'âge conduisent à privilégier les modèles qui prévoient une représentation hiérarchique de l'information en mémoire et un processus de recherche et de récupération de l'information du type haut-bas.

Story memory: immediate and delayed recognition of statements by 7, 8 and 10 years old children

   [ Illustration of standard Bayesian methods ] Three groups of 60 children (7, 8 and 10 years old) participated in an immediate and delayed (8 days) recognition experiment. Children had to identify original statements (segments of the story) and to reject statements which were semantically closed tp and distant from the original ones. The experiment intended to answer four questions: 1. Is there a level-effect present in recognition as there in recall? 2. Is there an effect of age similar in recognition and in recall? 3. Is the information stored in conceptual and/or lexical form? 4. Is the influence of the content of the stories different in recognition and in recall? The Bayesian Analysis of Comparisons (Bayesian extensions of ANOVA) leads to a negative answer to question 1, 2 and 4. The absence of a level-effect in immediate and delayed recognition and the small differences between the three age groups are in agreement with memory models which predict a hierarchical representation of information and a top down retrieval process.


Lecoutre B. (1983) - Introduction à l'Analyse Bayésienne des Comparaisons (extension bayésienne de l'analyse de la variance). Cahiers d'Anthropologie et Biométrie Humaine, 1, 47-93.

   On illustre, à partir d'exemples concrets, les procédures de base de l' Analyse Bayésienne desComparaisons et leurs implications méthodologiques. Cette extension bayésienne de l'analyse de la variance classique repose sur le recours à la formalisationalgébrique et sur l'idée d'inférence spécifique. Dans le cadre, les procédures fiducio-bayésiennes sont introduites, avec leur mise en oeuvre pratique et sont discutées, comme un prolongement direct - technique et conceptuel - des tests F usuels.

Introduction to the Bayesian Analysis of Comparaisons (Bayesian extension of the analysis of variance)

   Illustrated, with concrete examples, the basic procedures of the Bayesian Analysis of Comparisons and their methodological implications. This Bayesian extension of the classical analysis of variance - introduced here in the basic situation of inference on the effect of a contrast between means - consists on: 1) the algebraic formalization, which enables to bring out the structures which arise in most usual designs; 2) the idea of specific inference, which allows, in each situation, standard Bayesian procedures to be applied. In this framework, Bayes-fiducial methods are introduced, with practical considerations, and discussed as a direct - technical and conceptual - extension of the usual F-test ANOVA.


Rouanet H., Lecoutre B. (1983) - Specific inference in ANOVA: From significance tests to Bayesian procedures. BritishJournal of Mathematical and Statistical Psychology, 36, 252-268.

   Whenever in a complex design inferences on separate effects are sought, the (overall) distributional assumptions of a general model are irrelevant. The specific inference approach is examined as a useful alternative to the conventional general model approach. The specific inference for a particular effect, based only on data relevant to this effect, is valid regardless of the complexity of the design. Specific inference is first discussed in terms of significance testing. It is argued that the usual ANOVA table can be regarded as a system of specific analyses, each on resting on a separate specific model in its own right. Then specific inference is discussed within a Bayesian framework. A standard Bayesian ANOVA is suggested as a direct extension of the usual F -test ANOVA. Technical developments and methodological implications are outlined.


Lecoutre B. (1984)L'Analyse Bayésienne des Comparaisons. Lille: Presses Universitaires de Lille.

    Cet ouvrage se situe dans un courant de recherche, né en France dans les années 1970, à partir des travaux de H. Rouanet et D. Lépine, qui consiste à refondre, à partir d'une formalisation algébrique, les méthodes traditionnelles s'analyse statistique des données expérimentales. Les données des chercheurs sont en règle générale des données structurées ; la formalisation des structures, étroitement liée au plan de recueil des données (plan d'expérience ou plan d'enquête) fournit un cadre aux questions que le chercheur se pose à propos de ses données. Le problème de la généralisabilité des conclusions est incontournable; l'idée d' inférence spécifique permet, à l'intérieur de chaque situation, d'appliquer des procédures inférentielles adaptées pour les structures qui interviennent dans cette situation. Il s'agit de fournir des procédures, répondant aux objectifs réels de l'induction; les procéduresbayésiennes, envisagées comme un prolongement des tests de signification usuels, permettent notamment de se prononcer sur l'importance de chaque effet examiné, et non seulement sur son existence; en particulier les procéduresfiducio-bayésiennes expriment, pour chaque question posée par le chercheur, "ce que les données ont à dire", indépendamment de toute information extérieure. Il en résulte une construction nouvelle, de plus en plus autonome par rapport aux développements traditionnels de l'analyse de la variance à l'anglo-saxonne: l' Analyse Bayésienne des Comparaisons, parce que la notion formalisée de comparaison y joue un rôle central.


Lecoutre B. (1985a) - How to derive Bayes-fiducial conclusions from usual significance tests. Cahiers de Psychologie Cognitive 5, 553-563.

    It is shown, in the case of the inference on a contrast between means, how Bayes-fiducial analyses can be carried out, given only the observed effect and the significance level; Bayes-fiducial limits can be obtained immediately by mean of tables, in order to establish whether an effect is negligible or notable. The role of significance testing in experimental methodology is thus discussed as far as the generalizibility of descriptive conclusions about the magnitude of effects is concerned.


Lecoutre B. (1985b) - Reconsideration of the F test of the analysis of variance: The semi-Bayesian significance tests. Communications in Statistics: Theory and Methods, 14, 2437-2446.

   The usual F-test of the analysis of variance is reconsidered within the Bayesian framework, in terms of predictive distributions. This leads to the notion of semi-Bayesian significance test, so called because it consists in only probabilizing the space of nuisance parameters, thus bringing a general principle for "eliminating" nuisance parameters, or more exactly incorporating information about these parameters. The approach is shown to extend the F-tests, by allowing the testing of hypotheses of non-zero effects.

Key words:  Significance tests; nuisance parameters; Bayesian predictive distribution; analysis of variance; F and psi-square distributions.


Rouanet H., Bernard J.-M., Lecoutre B. (1986) - Non-probabilistic statistical inference: A set theoretic approach. The American Statistician, 40, 60-65.

   The familiar sampling procedures of statistical inference can be recast within a purely set-theoretic (ST) framework, without resorting to probabilistic prerequisites. This article is an introduction to the ST approach of statistical inference, with emphasis on its attractiveness for teaching. The main points treated are unsophisticated ST significance testing and ST inference for a relative frequency (proportion).

Key words:  Teaching of statistics: probability.


Rouanet H., Lecoutre B., Bernard J.-M. (1986) - L'inférence fiducio-bayésienne comme méthode d'analyse de données: Un exemple d'application à des données psychométriques. Statistique et Analyse desDonnées, 11, 58-74.

   Cet article illustre les apports méthodologiques de l'inférence fiducio-bayésienne. On présente d'abord les principes de cette approche, puis une application à des données psychométriques, enfin les résultats théoriques principaux.

Mots-clés:  Inférence fiducio-bayésienne.

Bayes fiducial inference as a data analysis method: Example of applicationto psychometric data

   The aim of this article is to illustrate the methodological aspects brought by the Bayes-fiducial approach to inference. It first presents the principles of this approach, then an application to psychometric data, last the main theoretical results.


Ciancia F., Maitte M., Honoré J., Lecoutre B., Coquery J.-M. (1988) - Orientation of attention and sensory gatting: An evoked potential and RT study in cat. Experimental Neurology, 100, 274-287.

   [Illustration of standard Bayesian methods] "Analysis of variance was extended by standard Bayesian inferences. Whereas F ratio is only a test of the null hypothesis delta=0, standard Bayesian inferences enabled us to investigate the magnitude of delta. To a significant result, a statement of this kind is added: P(delta<X)=0.95 or P(delta>X)=0.95, indicating which value (X) from the delta parameter has a 0.95 probability of being exceeded. In the case of a nonsignificant effect a statement of the following kind is calculated: P(|delta|<X)=0.95, giving the interval centered on 0 and containing with a probability of 0.95 the true effect: if the value of X is small, the effect must, with reason, be considered negligible."


Lecoutre B. (1988) - L'analyse des comparaisons à plusieurs degrés de liberté comme prolongement des procédures élémentaires. L'AnnéePsychologique, 88, 395-403.

   La présente note généralise aux comparaisons à plusieurs degrés de liberté l'article de Hoc (1985), qui montrait comment l'analyse des comparaisons à un degré de liberté peut être regardée comme un prolongement direct des procédures statistiques élémentaires, tant descriptives qu'inférentielles.

Mots-clés:  Analyse de la variance; analyse des comparaisons;inférence spécifique.

The analysis of several degrees of freedom comparisons as an extensionof elementary procedures

   This paper extends to several degrees of freedom comparisons the article of Hoc (1985), which showed how the analysis of one degree of freedom comparisons can be viewed as a direct extension of elementary statistical procedures,descriptive as well as inferential.

Key words:  Analysis of variance; analysis of comparisons; specific inference.


Lecoutre M.-P., Durand J.-L., Cordier J. (1990) - A study of two biases in probabilistic judgments: representativeness and equiprobability. In J.-P. Caverni, J.-M. Fabre & M. Gonzales (Eds): CognitiveBiases, Elsevier Science Publihers B.V., North Holland, 563-575.

   From an experimental study of two biases in probabilistic judgments - the representativeness bias in situations of inductive inference, and the equiprobability bias in "purely random" situations - it is shown that it is possible to characterize two types of cognitive aids which differ by their impact point: the object to which the probabilistic judgment pertains (for the representativeness bias), or the activated representation (for the equiprobability bias).


Lecoutre B. (1991) - A correction for the epsilon approximate test in repeated measures designs with two or more independent groups. Journal of Educational Statistics, 16, 371-372.

   The routine epsilon approximate test procedure in repeated measures designs (Huyhn & Feldt, 1976; Huynh, 1978) when the condition of circularity is not fulfilled uses an erroneous formula in the case of two or more groups. This may lead to a substantial underestimation of the deviation from circularity when the total number of subjects is small.

Key words:  ANOVA; circularity; sphericity.


Lecoutre B., Guigues J.-L., Poitevineau J. (1992) - Distribution of quadratic forms of multivariate Student variables. Applied Statistics, 41, 617-627.

   Bayesian analysis of normal models involves quadratic forms of multivariate generalized Student t -variables, hence the definition of the psi-square distribution (Lecoutre, 1981). From the density of the psi-square distribution, its cumulative distribution function can be written as a mixture of the usual incomplete beta integrals. A numerical computational method is developed (algorithm AS 278).

Key words:  Alternate non-central F-distribution; probability integral; psi-square distribution; series approximation.


Lecoutre M.-P. (1992) - Cognitive models and problem spaces in "purely" random situations. Educational Studies in Mathematics, 23, 557-568.

   As part of a study on the natural interpretations of probability, experiments about elementary "purely random" situations (with dice or poker chips) were carried out using students of various backgrounds in the theory of probability. A prior study on cognitive models which analyzed the individual data of more than 600 subjects had shown that the most frequent model used is based on the following incorrect argument: the results to compare are equiprobable because it's a matter of chance; thus, random events are thought to be equiprobable "by nature". The present paper is divided into two parts. In the first, the findings of a series of experiments are summarized. In the second, the following two hypotheses are tested: (1) Despite their incorrect model, subjects are able to find the correct response. (2) They are more likely to do so when the "chance" aspect of the situation has been masked. An experiment testing 87 students showed, as expected, that there is a way to induce the utilization of an appropriate cognitive model. However, the transfer of this model to a classical random situation is not as frequent as one might expect.


Lecoutre M.-P., Rouanet H. (1993) - Predictive judgments in situations of statistical analysis. Organizational Behavior and Human Decision Processes, 54, 45-56.

   Probabilistic judgments made by researchers in psychology were investigated in statistical prediction situations. From these situations, it is possible to test the "representativeness hypothesis" (Tversky & Kahneman, 1971) and the "significance hypothesis" (Oakes, 1986). The predictive judgments concerned both an elementary descriptive statistic and a significance test statistic. In the first case, the predictive judgments were generally coherent and it comparatively well to Bayesian standard predictive probabilities. As for the two hypotheses tested, our findings are compatible with the significance hypothesis, but go against the representativeness hypothesis.


Lecoutre B. (1994) - Inférence statistique et raisonnement inductif. Psychologie Française, 39, 141-151.

    On examine l'utilisation et les apports de l'inférence statistique dans l'étude des raisonnements inductifs. On montre que certains aspects de ne sont pas toujours clairement pris en compte. En particulier on a souvent utilisé une approche exclusivement normative de l'inférence bayésienne, alors que celle-ci est en fait une construction beaucoup plus souple et beaucoup plus élaborée qu'il peut apparaître. On insiste sur la nécessité de l'articulation d'une approche normative et d'une approche descriptive, visant à étudier la cohérence des réponses, plutôt que leur exactitude.

Statistical inference and inductive reasoning

   The use and the contribution of statistical inference in studying inductive reasoning is investigated. It is shown that some aspects are not always clearly taking into account. In particular, an exclusive normative use of Bayesian inference has often been involved. Bayesian inference is in fact a more flexible and elaborated construction that it can appear. Furthermore, the need for articulating a normative approach and a descriptive approach, in order to study the coherence of the responses rather than their accuracy, is stressed.


Lecoutre B., Derzko G., Grouin J.-M. (1995) - Bayesian predictive approach for inference about proportions. Statistics in Medicine, 14, 1057-1063.

   This paper investigates the Bayesian procedures for comparing proportions. These procedures are especially suitable for accepting (or rejecting the equivalence of two population proportions. Furthermore the Bayesian predictive probabilities provide a natural and flexible tool in monitoring trials, especially for choosing a sample size and for conducting interim analyses. These methods are illustrated with two examples where antithrombotic treatments are administrated to prevent further occurrences of thromboses.


Grouin J.-M., Lecoutre B. (1996) - Probabilités prédictives: Un outil pour la planification des expériences. Revue de Statistique Appliquée, XLIV, 21-35.

   Cet article présente une des nombreuses applications possibles de l'inférence bayésienne prédictive au contexte des essais planifiés. Nous nous intéressons ici à la planification d'une expérience où l'objectif est la mise en évidence de l'importance d'un effet d'intérêt: compte tenu d'un premier échantillon E1 de données, on veut planifier une expérience, soit un nouvel échantillon E2. Après avoir rappelé la procédure générale usuelle, basées sur la notion de puissance, utilisée pour déterminer l'effectif nécessaire de l'échantillon E2, ainsi que les critiques adressées à cette procédure, nous envisageons le calcul de la probabilité prédictive d'obtenir une conclusion d'effet notable basée sur le futur échantillon à partir de méthodes d'inférence bayésienne. Nous déterminons également l'effectif nécessaire de l'échantillon E2 correspondant à une probabilité prédictive donnée d'obtenir la conclusion recherchée. Les méthodes présentées sont illustrées dans le cadre de la planification d'une expérience de psychologie.

Mots-clés:  Prédiction; inférence bayésienne; planification; effectif nécessaire; importance d'un effet.

Predictive probabilities: A tool for planning experiments

    This paper presents one use of the Bayesian predictive inference in the context of experiments. We are interested here in the design of a trial which aims at showing the importance of an experimental effect: given first data accumulated from a previous trial we want to determine the required sample size of a new trial for achieving with high chances the statistical conclusion of the effect importance obtained from a Bayesian inference method and based on the new trial future data. After presenting the usual procedure based on the power for determining the required sample size and assessing this procedure critically, we consider Bayesian predictive procedures to determine the required sample size. The methods are applied to design an experiment of Psychology.

Key words:  Prediction;Bayesian inference, Trial design, Sample size, Effect importance.


Lecoutre B. (1996a)Traitement statistique des données expérimentales: Des pratiques traditionnelles aux pratiques bayésiennes - Avec programmes Windows par B. Lecoutre et J. Poitevineau. Paris: DECISIA Editions

   Cet ouvrage propose à l'utilisateur de l'analyse de variance une approche pratique, réaliste et constructive de l'inférence statistique, qui lui apporte un regard nouveau sur ses données. Les procédures bayésiennes standard sont aussi objectives et simples à utiliser que les procédures traditionnelles (tests de signification t ou F familiers, intervalles de confiance). Intégrant ces dernières, elles en éclairent les difficultés et les insuffisances, et renouvellent en profondeur la méthodologie du traitement statistique des données expérimentales.

   Des réponses concrètes sont apportées à des questions essentielles dans la pratique.
Interprétation - Comment interpréter correctement les procédures d'inférence statistique?
Importance des effets - Comment juger de l'importance d'un effet:
   significativité clinique (psychologique...)" et "significativité statistique"?
   peut-on "prouver l'hypothèse nulle" d'absenced'effet quand c'est l'hypothèse de recherche?
Apport réel des données - Comment apprécier "ce que les données ont à dire" et examiner dans quelle mesure des informations supplémentaires remettraient en cause les conclusions?
Plans d'expérience complexes - Comment analyser les plans expérimentaux complexes largement utilisés, tels que les dispositifs avec mesures répétées ou croisés ( cross-over )?
Conditions de validité - Comment comparer des moyennes sans supposer l'égalité des variances?
Choix des effectifs - Comment déterminer les effectifs nécessaires pour "avoir de bonnes chances" d'obtenir une conclusion donnée?

   La présentation des méthodes est effectuée à partir d'exemples réels. Les programmes informatiques sous Windows (réalisés en collaboration avec Jacques Poitevineau), didactiques et conviviaux, permettent la mise en oeuvre interactive très simple de toutes les procédures au fur et à mesure de leur exposé. L'ouvrage présente ainsi une conception originale, qui en fait pour le plus grand nombre de lecteurs (étudiants, enseignants, chercheurs, statisticiens...) un outil précieux, utilisable aussi bien pour une initiation au traitement des données expérimentales que pour des applications sophistiquées.

Sommaire:  Quelques éléments de réflexion -- Du t de Student aux procédures fiducio-bayésiennes -- De l'ANOVA aux procédures fiducio-bayésiennes -- Prise en compte d'informations extérieures aux données -- Analyse spécifique: Plans S<G>*O -- Analyse spécifique: Illustrations -- Comparer des moyennes sans supposer l'égalité des variances -- Compléments sur les procédures fréquentistes -- Déterminer les effectifs nécessaires -- Distributions utiles -- Solutions bayésiennes -- Annexes: les programmes Windows -- Références bibliographiques -- Index.


Lecoutre B. (1996b) - Au delà du test de signification ou l'inférence statistique sans tables (à la suite d'Alain Morineau). La Revue de Modulad, 17, 98-100.

    En fait nous n'avons pas seulement (ou même nous n'avons pas...) besoin d'une procédure de décision brutale, qui ne concerne que la valeur zéro et ne nous renseigne pas sur l'importance réelle de la corrélation. Mais nous devons aussi pouvoir "tester" d'autres valeurs, et plus simplement obtenir une "fourchette" qui nous permette d'apprécier réellement l'information apportée par les données. Nous allons rappeler que, dans les cas les plus courants de traitements de données numériques, il est immédiat de passer du test usuel à cette fourchette. Bien entendu il faudra justifier et interpréter celle-ci; on pourra se réjouir de savoir qu'elle peut être regardée comme un intervalle de confiance (fréquentiste), comme un intervalle fiduciaire, ou comme un intervalle de crédibilité bayésien standard. Dans la suite nous l'appellerons simplement "intervalle", laissant le lecteur libre de choisir son cadre de justification et d'interprétation.


Lecoutre B. (1997/2005) - Et si vous étiez un bayésien "qui s'ignore"? La Revue de Modulad, 18, 81-87 [traduction en espagnol: ¿Y si Usted es un bayesiano sin "saberlo"? par Ramón Alvarez, Université de Montevideo, Uruguay]. Réédition (complétée): La Revue de Modulad, 32, 92-105.

   L'objet de cet article est de guider le lecteur peu familiarisé dans la découverte de l'inférence bayésienne. Quatre idées pourront motiver cette découverte: l'inférence bayésienne n'est pas récente; elle apparaît supérieure sur le plan théorique; elle est une inférence naturelle; elle va devenir de plus en plus facilement utilisable. L'exposé sera très partiel (et partial), avec tous les oublis et toutes les insuffisances inévitables s'agissant d'un sujet aussi débattu que l'inférence statistique.

¿Y si Usted es un bayesiano sin saberlo?

   El objeto de este articulo es el de guiar al lector poco familiarizado hacia el descubrimiento de la inferencia bayesiana. Cuatro ideas podrán motivar este descrubimiento: la inferencia bayesiano no es reciente; aparece suyperior en el plano teóretico;es una inferencia natural; se va a volver dad vez más utilizable.


Lecoutre B. (1998) - Teaching Bayesian methods for experimental data analysis. In L. Pereira-Mendoza, L. Seu, T. Wee, W K. Wong (Eds.): Statistical Education - Expanding the Network, Proceedings of the fifth International Conference onTeaching of Statistics, Vooburg, Netherlands: ISI Permanent Office, Vol.1, 239-244.

   The innumerable articles denouncing the deficiencies of significance testing urge us to reform the teaching of statistical inference for experimental data analysis. Bayesian methods are a promising alternative. However, teaching the Bayesian approach should not introduce an abrupt changeover from the current frequentist procedures: at the very least, the two approaches should co-exist for many years to come. According to this fact, we have developed statistical computer programs, that incorporate both current practices and standard Bayesian procedures. These programs are used in the graduate statistics course in psychology, where Bayesian methods are especially introduced for inferences about effect sizes in the analysis of variance framework.


Lecoutre M.-P., Fischbein E. (1998) - Étude de l'évolution de biais probabilistes avec l'âge à partir de résultats obtenus en France et en Israël. Recherches en Didactique des Mathématiques, 18, 311-332.

   Dans la recherche présentée ici, il s'agit d'étudier l'évolution avec l'âge de certaines "misconceptions" dans les évaluations intuitives de probabilités. La motivation principale de cette recherche "exploratoire" est de faire progresser la connaissance des différents modèles cognitifs activés dans les situations d'incertitude considérées. Un objectif secondaire a consisté à comparer les résultats obtenus en France et en Israël. La recherche effectuée auprès de 687 sujets en France et 98 sujets en Israël, répartis dans cinq groupes d'âges (11, 13, 15, 17ans, et des étudiants), a montré que les résultats apparaissent complexes: certaines fréquences de réponses biaisées diminuent avec l'âge (c'est le cas notamment pour les effets de récence et le biais de représentativité), alors que d'autres augmentent (en particulier les erreurs liées au "phénomène Falk" sur les probabilités conditionnelles). Une discussion de ces résultats, et certains éléments interprétatifs sont proposés à la lumière des modèles cognitifs utilisés par les sujets.

Study of the evolution with age of probabilistic biases from results in France and Israel

   This research aims to investigate the evolution, with age, of probabilistic intuitively based misconceptions. The main purpose of this "exploratory" experiment is to analyze the different cognitive models which were activated in the various uncertainty situations considered here. A secondary object is to compare the findings obtained in France and in Israel. The results obtained from 687 subjects in France and 98 in Israel in grades 5, 7, 9, 11 and from students, are very complex: some misconceptions grow stronger with age (it's the case in particular for the recency effects and the representativeness bias), whereas others grow weaker (especially for the "Falk phenomenon" related to conditional probabilities). A discussion and interpretation of these results, with the help of the notion of cognitive models spontaneously developed by the subjects, are proposed.


Lecoutre M.-P., Rezrazi M. (1998) - Learning and transfer in isomorphic uncertainty situations: The role of the subject's cognitive activity. In L. Pereira-Mendoza, L. Seu, T. Wee, W K. Wong (Eds.): Statistical Education - Expanding the Network, Proceedings of the fifth International Conference onTeaching of Statistics, Vooburg, Netherlands: ISI Permanent Office, Vol.3, 1105-1111.

   Our previous research has shown the difficulties encountered by adult subjects in elementary "purely random" situations, however simple they may be. Indeed, those imply either the throws of two dice, or the simultaneous drawing of two poker chips among three, and thus do not require to be expert in probability. We hypothesized that prior knowledge guides spontaneous representations and that the "errors" observed can be explained by the activation of "tacit models". More precisely, we hypothesized that the correct combinatorial representations are available to most subjects, but that experimental tricks are required to activate them. This paper will focus on the role of the subject's cognitive activity who is led to construct by himself a correct representation. So, we used a learning paradigm and we tested the transfer on isomorphic problems. Results show the positive role of the subject's cognitive activity , and above all its strong effect in the transfer of correct representations to isomorphic situations.


Poitevineau J. (1998)Méthodologie de l'analyse des données expérimentales - Étude de la pratique des tests statistiques chez leschercheurs en psychologie, approches normative, prescriptive et descriptive / Methodology of the analysis of experimental data: A study of the use of significance tests by psychologists, from normative, prescriptive, and descriptive approaches . Thèse de doctorat de psychologie / Doctoral thesis in psychology , Université de Rouen.

   La thèse présentée est celle de l'inadaptation à la recherche expérimentale de la pratique du test de signification par les chercheurs en psychologie. La question de cette inadaptation est abordée selon trois approches, normative, prescriptive et descriptive qui constituent les trois parties de la thèse.

   La première partie est consacrée à l'étude, d'un point de vue méthodologique, de la norme statistique constituée par les théories du test statistique de Fisher et de Neyman et Pearson. Les principales caractéristiques de ces deux théories sont rappelées puis les nombreuses critiques dont les tests continuent d'être l'objet sont examinées, ainsi que les abus d'utilisation et des raisons possibles de la persistance de l'usage des tests et des abus.

   La deuxième partie aborde la question de la pertinence des prescriptions. Parmi les principales solutions de rechange aux tests qui sont passées brièvement en revue, seules les méthodes d'intervalle de confiance et les méthodes bayésiennes paraissent devoir s'imposer comme véritables "challengers" des tests traditionnels. De l'analyse de six des manuels d'inférence statistique à l'usage des psychologues parmi les plus connus, il ressort que les théories des tests statistiques y sont rarement rapportées fidèlement et qu'ils contiennent déjà des abus d'interprétation, particulièrement dans les exemples présentés.

   La troisième partie est consacrée aux attitudes des chercheurs en psychologie à l'égard des tests de signification. Des réanalyses statistiques de résultats déjà publiés ainsi qu'une réanalyse que nous avons menée au moyen d'outils fiducio-bayésiens sont présentées. Nous relatons aussi des d'expériences menées auprès de chercheurs, dont deux expériences que nous avons réalisées.

   Nous concluons à une pratique inadaptée au plan méthodologique, mais socialement adaptée, d'un outil inadéquat dont le mode d'emploi est trompeur. Nous évoquons aussi le probable changement d'attitude des psychologues vis-à-vis du test de signification, en conséquence de prochaines recommandations de l' American PsychologicalAssociation, et les possibilités d'une plus grande utilisation de l'analyse bayésienne qui en découlent.

Mots-clés:  Inférence statistique; méthodologie; méthodes bayésiennes; raisonnement inductif; tests de signification.

Methodology of the analysis of experimental data: A study of the use of significance tests by psychologists, from normative, prescriptive, and descriptive approaches

   The thesis presented is that the current use of significance tests by psychologists is unsuited for experimental research. This question is examined through three approaches, normative, prescriptive and descriptive, which constitute the three parts of the dissertation.

   The first part is devoted, from a methodological viewpoint, to the study of the theories of statistical test developed by Fisher and by Neyman and Pearson, and which now constitute the statistical norm. The main features of these theories are first described, then the numerous criticisms which are still directed at the statistical tests are examined. Misuses of tests are also examined, as well as possible reasons for the continued use of these tests.

   The second part deals with the pertinence of the prescriptions. Among the main alternatives to the tests reviewed, only confidence interval methods and Bayesian methods seem to be potential challengers to the traditional tests. From the analysis of six popular textbooks of statistical inference designed for psychologists, it appears that the theories of statistical test are rarely accurately reported and that those textbooks contain some misuses, particularly among the examples used.

   The third part is devoted to the attitudes of psychologists toward significance tests. Some statistical re-analyses of published results are presented, as long as a re-analysis we performed using standard Bayesian tools. Some experiments involving researchers as subjects are also reported, including the two we realized for this thesis.

   We conclude that the use of significance tests by psychologists is a socially adapted but methodologically unsuited use of an inadequate tool promoted through misleading guide-lines of standard textbooks. We also mention a probable change in psychologists' attitude toward significance tests, as a consequence of recommendations from the AmericanPsychological Association that are likely to appear in the near future, and the possibility that Bayesian analysis will become more and more used. Key words:  Statistical inference; methodology; Bayesian methods; inductive reasoning; significance tests.


Poitevineau J., Lecoutre B. (1998) - Some statistical misconceptions in Chow's statistical significance [Commentary on Chow, S.L. - StatisticalSignificance: Rationale, Validity and Utility, London: Sage]. Behavioral and Brain Sciences, 21, 215.

   Chow's book makes a provocative contribution to the debate on the role of statistical significance, but it involves some important misconceptions in the presentation of the Fisher and Neyman-Pearson's theories. Moreover, the author's caricature-like considerations about "Bayesianism" are completely irrelevant for discarding the Bayesian statistical theory. These facts call into question the objectivity of his contribution.


Lecoutre B. (1999a) - Two useful distributions for Bayesian predictive procedures under normal models. Journal of StatisticalPlanning and Inference, 77, 93-105.

   The K-prime and K-square distributions, involved in the Bayesian predictive distributions of standard t and F tests are investigated. They generalize the classical noncentral t and F distributions and can receive different characterizations. Their moments and their probability density and distribution functions are made explicit.

Key words:  Predictive distributions; normal models; t tests; F ratios.


Lecoutre B. (1999b) - Beyond the significance test controversy: Prime time for Bayes? In A. Rossman and B. Chance (Eds), Bulletin of the International Statistical Institute: Proceedings of the Fifty-second Session of the International Statistical Institute, Tome 58, Book 2, 205–208. http://www.stat.fi/isi99/proceedings.html ].

   The purpose of this paper is to argue that a widely accepted objective Bayesian methods, with the Fisher's fiducial motivation, are not only desirable but also feasible. These methods bypass the common misuses of null hypothesis significance testing and offer promising new ways in statistical methodology.


Mabika B. (1999)Analyse bayésienne des données de survie - Application à des essais cliniques enpharmacologie / Bayesian analysis of survival data - Application to clinical trials in pharmacology . Thèse de doctorat de mathématique / Doctoral thesis in mathematics , Université de Rouen.

   Cette thèse est composée de deux parties distinctes: la première relève des procédures bayésiennes des données de survie et la seconde traite la méthodologie d'application des procédures bayésiennes.

   Nous étudions dans la première partie des méthodes bayésiennes permettant de comparer deux distributions de survie de Weibull censurées. Les résultats sont présentés en utilisant l'hypothèse selon laquelle les paramètres de forme sont quelconques. Pour une classe de loi a priori convenablement choisie, nous donnons les distributions a posteriori, les intervalles à plus forte densité aposteriori (HPD) des paramètres d'intérêt nécessaires pour montrer soit la supériorité clinique soit l'équivalence. Nous introduisons ensuite un estimateur deBayes de la fonction de survie à un temps quelconque. Nous proposons et étudions un test bayésien pour l'équivalence de deux fonctions de survie dans le cas des modèles à taux de risque constant et non constant. Un algorithme utilisant la méthode de simulation de l'échantillonnage de Gibbs est donné pour résoudre ce problème de test. En outre une approche prédictive est étudiée pour interrompre un essai de façon précoce. Les densités prédictives sont utilisées pour obtenir une règle d'arrêt dans le cas des analyses intermédiaires. Nous proposons également deux approches de détermination du nombre de sujets nécessaires en utilisant les critères usuels: l'une est basée sur la simulation des densités prédictives, l'autre est basée sur les approximations normales des densités prédictives. Enfin nous généralisons le modèle de Weibull par une approche bayésienne avec des variables explicatives qui est très proche du modèle semi-paramétrique de Cox.

   La seconde partie est consacrée aux exemples d'applications à des données d'essais cliniques pour comparer deux traitements ou pour déterminer le nombre de patients nécessaires.

Mots-clés:  Adaptive rejection Metropolis sampling; analyses intermédiaires; censure à droite; densités prédictives; distribution de Weibull; Etude de la mortalité; Echantillonnage de Gibbs; Fonction de survie;Méthodes bayésiennes; Méthodes de Monte Carlo par chaîne de Markov.

Bayesian analysis of survival data - Application to clinical trials in pharmacology

   The first Part deals with the Bayesian procedures of survival data and the second Part with the methodology of the application of Bayesian methods.

   In the first Part, we study the Bayesian framework to compare two Weibull survival distributions with unequal shape parameters, in the case of right censored survival data obtained for two independent samples. For a family of appropriate priors we give the posterior distributions and the highest posterior density (HPD) intervals about relevant parameters allowing to search for a conclusion of clinical superiority of a treatment. We introduce a Bayesian estimator of the survival function. We propose a Bayesian test for the equivalence of two survival functions and we define an algorithm using Gibbs sampling. Moreover, the predictive distributions are studied and used to obtain an early stopping rule in the case of interim analyses. Lastly, we generalize the Weibull model by a Bayesian approach with covariates, close to Cox's model. Markov Chain Monte Carlo methods are used.

   In the second Part, the methods are illustrated with some examples of mortality studies in cardiology and cancer research where a new treatment is compared with a standard treatment.

Key words:  Adaptive rejection Metropolis sampling; Bayesian methods; Gibbs sampling; interim analyses; mortality study; Markov chain Monte Carlo method; predictive distributions; right censoring; survival function; Weibull distribution.


Poitevineau J. (1999) - Pratiques des tests statistiques en psychologie cognitive: L'exemple d'une année d'un journal. Cahiers du LCPE, 3, 67-87.

   En 1962 Cohen a publié une recherche qui a servi de modèle à beaucoup d'autres. Son objectif premier était d'ordre méthodologique: mettre en évidence certains problèmes soulevés par l'usage des tests de signification, et éventuellement en tirer les conséquences pour une meilleure pratique. Il s'agissait pour lui de voir comment les psychologues, si soucieux de se prémunir contre l'erreur de première espèce, se gardaient de l'erreur de seconde espèce. Autrement dit, voir si la puissance des tests utilisés par les psychologues était suffisante pour que l'hypothèse nulle ait de bonnes chances d'être rejetée quand elle est fausse. A cette fin il a analysé tous les articles parus dans le volume 61 (1960) du Journal of Abnormal and Social Psychology. Mais dans ce type d'étude, les données (les effets, les statistiques de test) apparaissant dans les articles n'ont aucun rôle: pour calculer la puissance du test utilisé il suffit de connaître la structure du plan d'analyse, les effectifs, et la valeur de l'effet vrai qui est fixée par hypothèse.
   Nous présentons une réanalyse que nous avons effectuée dans une perspective plus descriptive que celle en jeu dans les études de puissance comme celle de Cohen: il s'agit, d'une part de recenser quels sont les abus d'interprétation des tests explicitement commis, et d'autre part de chercher à préciser quelle est la portée réelle des conclusions autorisées en ce qui concerne l'importance des effets, en relation précisément avec les abus (ou les insuffisances) des interprétations fournies par les auteurs. En retour cela permettra d'examiner si les tailles d'échantillon sont suffisantes pour obtenir des conclusions satisfaisantes sur l'importance des effets (relativement à un certain critère). La méthode fiducio-bayésienne qui utilise une distribution a priori non informative nous servira de norme: c'est dans le cadre de cette méthode, et donc par rapport à elle, que nous tâcherons de répondre en examinant comment les conclusions tirées par les chercheurs à partir de tests statistiques usuels pourraient être prolongées ou modifiées. Cette méthode permet de choisir le type d'inférence a posteriori, ce que ne permettent pas, en toute rigueur, les méthodes fréquentistes (de test ou d'intervalle de confiance) de recherche de conclusion d'effet négligeable ou notable. Pour faciliter la comparaison avec les études antérieures, nous avons choisi de réanalyser des articles parus dans le Journal of Abnormal Psychology. Nous avons retenu le volume 103 (année 1994), c'est-à-dire le plus récent disponible au moment de ce travail.


Lecoutre B. (2000) - From significance tests to fiducial Bayesian inference. In H. Rouanet, J.-M. Bernard, M.-C. Bert, B. Lecoutre, M.-P. Lecoutre, B. Le Roux, New ways in statistical methodology: From significance tests to Bayesian inference [2nd edition, 1st edition 1998], Bern, Switzerland: Peter Lang, 123-157.

   In this chapter we shall examine how, when analyzing experimental data, the researcher can call on intuitive knowledge to understand the principles and methodological implications of two of the main statistical inference procedures, namely, the traditional significance test and fiducial Bayesian inference. The underlying general problem will be the comparison of means in experimental designs. This problem is usually considered in an analysis of variance framework. In fact, it can be amply illustrated here in the case of a simple situation of inference concerning a mean.


Lecoutre B., Charron C. (2000) - Bayesian procedures for prediction analysis of implication hypotheses in 2×2 contingency tables. Journal of Educational and Behavioral Statistics, 25, 185-201.

   Procedures for prediction analysis in 2×2 contingency tables are illustrated by the analysis of successes to six types of problems associated with the acquisition of fractions. According to Hildebrand, Laing, and Rosenthal (1977), hypotheses such as "success to problem type A implies in most cases success to problem type B" can be evaluated from a numerical index. This index has been considered in various other frameworks and can be interpreted in terms of a measure of predictive efficiency of implication hypotheses. Confidence interval procedures previously proposed for this index are reviewed and extended. Then, under a multinomial model with a conjugate Dirichlet prior distribution, the Bayesian posterior distribution of this index is characterized, leading to straightforward numerical methods. The choices of "noninformative" priors for discrete data are shown to be no more arbitrary or subjective than the choices involved in the frequentist approach. Moreover, a simulation study of frequentist coverage probabilities favorably compares Bayesian credibility intervals with conditional confidence intervals.

Key words:  2×2 contingency tables; implication hypotheses; predictive efficiency; multinomial model; conditional confidence intervals; Bayesian inference.


Lecoutre B., Poitevineau J. (2000) - Aller au delà des tests de signification traditionnels: Vers de nouvelles normes de publication. L'Année Psychologique, 100, 683-713.

   Il y a de bonnes raisons de penser que le rôle des tests de signification usuels dans la recherche en psychologie sera considérablement réduit dans un proche avenir. Les résultats des analyses statistiques traditionnelles devraient être systématiquement complétés ("au delà des seuls seuils observés p") pour inclure systématiquement la présentation d'indicateurs de la grandeur des effets et leurs estimations par intervalles. Ces procédures pourraient rapidement devenir de nouvelles normes de publication. Dans cet article, nous passons d'abord en revue les principaux abus des tests de signification et les solutions de rechange proposées. Parmi celles-ci, des méthodes d'intervalle de confiance (fréquentistes) et des méthodes d'intervalles de crédibilité (fiducio-bayésiens) permettent d'estimer l'importance réelle des effets, et en particulier d'apprécier leur caractère négligeable ou notable. A partir d'un exemple numérique, nous illustrons ces méthodes pour l'analyse de contrastes entre moyennes dans un plan d'expérience complexe, en considérant à la fois les effets bruts et les effets relatifs (calibrés). Nous discutons les similitudes et les différences des approches fréquentistes et bayésiennes, leur interprétation correcte et leur utilisation pratique.

Beyond traditional significance tests: Prime time for new publication norms

   There are good reasons to think that the role of usual null hypothesis significance testing in psychological research will be considerably reduced in the near future. Traditional statistical analysis results should be enhanced ("beyond simple p value statements") to systematically include effect sizes and their interval estimates. Quite soon, these procedures could become new publication norms. In this paper main abuses of significance tests and alternative available solutions are first reviewed. Among these solutions, both confidence interval (frequentist) methods and credibility interval (fiducial Bayesian) methods have been developed for assessing effect sizes, and especially for asserting the negligibility or the notability of effects. From a numerical example, these methods are illustrated for analysing contrasts between means in a complex experimental design. Both raw and relative (calibrated) effects are considered. The similarities and differences between the frequentist and Bayesian approaches, their correct interpretations, and their practical uses, are discussed.


Lecoutre B., Poitevineau J., Derzko G., Grouin J.-M. (2000) - Désirabilité et faisabilité des méthodes bayésiennes en analyse de variance: Application à des plans d'expérience complexes utilisés dans les essais cliniques. In I. Albert et B. Asselain (Eds.), Biométrie et Méthodes bayésiennes, 14, 1-23.

   L'objectif de cet esposé est d'illustrer, pour reprendre l'expression de Lewis (1982), la désirabilité et la faisabilité des méthodes bayésiennes en analyse de variance. Il ne sera pas question ici de revenir sur les débats sur l'inférence statistique, mais simplement de montrer de manière constructive comment des procédures bayésiennes de routine peuvent être aisément mises en oeuvre et apporter des réponses simples et directes aux critiques méthodologiques formulées à l'encontre de l'usage des tests de signification usuels.


Lecoutre M.-P. (2000) - And... what about the researcher's point of view? In H. Rouanet, J.-M. Bernard, M.-C. Bert, B. Lecoutre, M.-P. Lecoutre, B. Le Roux, New ways instatistical methodology: From significance tests to Bayesian inference [2nd edition, 1st edition 1998], Bern, Switzerland: Peter Lang, 65-95.

   This chapter presents the findings of an experimental research project aimed at describing and analyzing the judgments made in situations of statistical inference by researchers (in this case, researchers in psychology) who, having completed an experiment, proceed to a statistical analysis of their data. The rest of the chapter is divided into two parts, one for each stage in the study. The first part examines the role of the various ingredients which contribute to the formulation of a statistical conclusion, along with the interpretations they give rise to. The second part, the study of statistical prediction situations, leads us to examine how a statistical conclusion is understood and interpreted: what significance do researchers attach to conclusions such as, for example "there is a difference between two treatments", or "there is an effect of such and such a factor", etc.


Rouanet H., Bernard J.-M., Bert M.-C., Lecoutre B., Lecoutre M.-P., Le Roux B. (2000)New ways in statistical methodology: From significance tests to Bayesian inference [2nd edition]. Bern, Switzerland: Peter Lang.

    This book, with a Foreword by the outstanding philosopher of science and mathematical psychologist Patrick Suppes of Stanford University, is the outgrowth of the work developed within the Groupe Mathématiques et Psychologie, a research unit of the University René Descartes and C.N.R.S. (the French National Center for Scientific Research). New ways in statistical methodology are presented, which complement the familiar significance tests by new methods better suited to the researchers' objectives, in the first place Bayesian methods. In mathematical statistics, Bayesian methods have made a breakthrough in the last few years, but those developments are still ignored by the current statistical methodology and practice. The present book is really the first one to fill this gap. This book is written for a large audience of researchers, statisticians and users of statistics in behavioral and social sciences, and contains both an analysis of the attitude of researchers toward statistical inference, and concrete proposals for improving statistical practice. The statistical consulting experience of the authors is centered around psychology and covers a broad range of subjects from social sciences to biostatistics. All methods developed by the authors are implemented in software.

Content: Foreword by Patrick Suppes -- Rouanet H., Statistics for researchers, 1-27 -- Rouanet H., Statistical practice revisited, 29-64 -- Lecoutre M.-P., And... what about the researcher's point of view, 65-95 -- Rouanet H., Bert M.-C., Introduction to combinatorial inference, 97-122 -- Lecoutre B., From significance tests to fiducial Bayesian inference, 123-157 -- Bernard J.-M., Bayesian inference for categorized data, 159-226 -- Rouanet H., Le Roux B., Bernard J.-M., Lecoutre B., Geometric data: From euclidean clouds to Bayesian MANOVA, 227-254.


Rouanet H., Le Roux B., Bernard J.-M., Lecoutre B. (2000) - Geometric data: From euclidean clouds to Bayesian MANOVA. In H. Rouanet, J.-M. Bernard, M.-C. Bert, B. Lecoutre, M.-P. Lecoutre, B. Le Roux, New ways in statistical methodology: From significance tests to Bayesianinference [2nd edition, 1st edition 1998], Bern, Switzerland: Peter Lang, 227-254.

   This final chapter provides an opening along two directions. Firstly, it deals with geometric data. Secondly, data are structured, that is to say there is a design to investigate several sources of variation [...]. To analyze such data,one may contemplate two lines of approach. Along the line of Geometric Data Analysis (GDA), as developed in France, one would start by representing data as clouds of points and proceed to the descriptive exploration of these clouds. Along the line of the Anglo-Saxon MANOVA tradition, one would start with a statistical model and proceed to inductive analyses. In this chapter, we present a statistical strategy which combines both approaches. As in GDA, we conceptualize statistical procedures as geometric operations on clouds of points, and as in MANOVA, we carry out inductive analyses. For each analysis, the procedures will be performed along the following three phases: (i) Descriptive analysis and observed effects; (ii) MANOVA significance testing and existence of effects; (iii) Bayesian MANOVA and importance (largeness) of effects.


Lecoutre B. (2001) - Bayesian predictive procedure for designing and monitoring experiments. Bayesian Methods with Applications to Science, Policy and Official Statistics, Luxembourg: Office for Official Publications of the European Communities, 301-310.

   In recent years many authors have stressed the interest of the Bayesian predictive approach for designing ("how many subjects?") and monitoring ("when to stop?") experiments. The predictive distribution of a test statistic can be used to include and extend the frequentist notion of power in a way that has been termed predictive power or expected power. More generally, Bayesian predictive procedures give the researcher a very appealing method to evaluate the chances that the experiment will end up showing a conclusive result, or on the contrary a non-conclusive result. The prediction can be explicitly based on either the hypotheses used to design the experiment, expressed in terms of the prior distribution, or on partial available data, or on both.


Lecoutre B., Derzko G. (2001) - Asserting the smallness of effects in ANOVA. Methods of Psychological Research 6(1) 1-32.

   Statistical inference procedures dedicated to asserting the smallness of effects are commonly used in the field of bioequivalence studies in pharmacology. They are however still virtually ignored in psychology. One possible reason is that experimental investigations generally involve complex designs for which solutions have not been developed in detail. The focus here is precisely on the extension of these procedures to all the situations where the usual ANOVA F tests apply. Smallness test and confidence interval procedures, both for raw effects, such as contrasts between means and their several df extensions, and for standardized effect size measures similar to Cohen's d and f, are considered. They are illustrated and contrasted with alternative Bayesian procedures. From a practical viewpoint, the computations require no more than the observed effect size, the usual F ratio, and percent points of statistical distributions.


Lecoutre B., Lecoutre M.-P., Grouin J.-M. (2001) - A Challenge for Statistical Instructors: Teaching Bayesian inference without discarding the "official" significance tests. Bayesian Methods with Applications to Science, Policy and Official Statistics, Luxembourg: Office for Official Publications of the European Communities, 311-320.

   The use of frequentist Null Hypothesis Significance Testing (NHST) is so an integral part of scientists' behavior that its uses cannot be discontinued by flinging it out of the window. Faced with this situation, our teaching strategy involves a smooth transition towards the Bayesian paradigm. Its general outlines are as follows. (1) To present natural Bayesian interpretations of NHST outcomes to draw attention to their shortcomings. (2)  To create as a result of this the need for a change of emphasis in the presentation and interpretation of results. (3) Finally to equip students with a real possibility of thinking sensibly about statistical inference problems and behaving in a more reasonable manner. Our conclusion is that teaching the Bayesian approach in the context of experimental data analysis appears both desirable and feasible.


Lecoutre B., Lecoutre M.-P., Poitevineau J. (2001) - Uses, abuses and misuses of significance tests in the scientific community: Won't the Bayesian choice be unavoidable? International Statistical Review, 69, 399-418

   Experimental research is facing a paradoxical situation. On the one hand, Null Hypothesis Significance Testing (NHST) is required in most scientific publications as an unavoidable norm. NHST is used to strengthen the data and convince the community of the value of the results. Furthermore, it often appears as a label of scientificness. But on the other hand, NHST leads to innumerable misinterpretations and misuses. Moreover, from the outset (Boring, 1919; Tyler, 1931; Berkson, 1938; etc.), NHST has been subject to intense criticism. Its use has been explicitly denounced by the most eminent and most experienced scientists, both on theoretical and methodological grounds, not to mention the sharp controversies that opposed Fisher to Neyman and Pearson on the very foundations of statistical inference. In the sixties, there was more and more criticism, especially in the behavioral and social sciences, denouncing the shortcomings of NHST and demonstrating its inadequacy in experimental data analysis. Most of these criticisms have been published in experimental journals so they could hardly remain unknown to most researchers. Findings from statistical re-analysis of published results and from experimental investigations of judgments carried out by researchers in situations of statistical inference reveal that the practice of NHST entails considerable distortions. This is especially true in the designing and monitoring of experiments, and in the selection and presentation of published results.

   So the time has come to reach a consensus on procedures that bypass the common misuses of NHST, while at the same time respecting its role of "an aid to judgement" which "should not be confused with automatic acceptance tests, or 'decision functions'." (Fisher, 1990/1925, page 128). This agreement should meet scientists' demands, in particular the need for objective statements and the need for procedures on effect sizes. Undoubtedly, there is increasing acceptance that Bayesian inference can be ideally suited for this purpose. Moreover the Bayesian school is progressively becoming the dominant school in mathematical statistics (see e.g., Berger, 1985; Bernardo & Smith, 1994; Robert, 1994; Schervich, 1995) and sooner or later it will have determining implications in teaching both students and scientific researchers. A not unreasonable belief is to anticipate the evolution of statistics and to think that in the future Bayesian inference will be the dominant approach. Lindley ( in Smith, 1995) even stated: "we [statisticians] will all be Bayesians in 2020, and then we can be a united profession

   The present article is divided into three parts. In the first normative part we briefly discuss the current context of the " significance test controversy ". In the second descriptive part we investigate from experimental findings, the attitudes of scientific researchers towards significance tests. We examine how misuses of these tests are linked to some major criticisms and can be seen as judgmental adjustments revealing the true needs of researchers towards statistical inference. In the third prescriptive part we examine the impact of alternative solutions. Consequently we automatically ask ourselves: " won't the Bayesian choice be unavoidable? "

Key words:  Bayes; confidence intervals; experimental data analysis; Fisher; significance tests controversy; statistical inference.

Usages, abus et mésusages des tests de signification dans la communauté scientifique:Le choix bayésien ne sera-t-il pasincontournable?

   Nous discutons d'abord brièvement le contexte actuel de la "controverse sur le test de signification". Puis nous présentons des recherches expérimentales sur l'usage des tests de signification de l'hypothèse nulle par des chercheurs scientifiques et des statisticiens professionnels. Les mauvais usages de ces tests sont reconsidérés comme des jugements adaptatifs, qui révèlent les exigences des chercheurs envers l'inférence statistique. Finalement, nous envisageons les solutions de rechange. Nous en venons naturellement à poser la question: "le choix bayésien ne sera-t-il pas incontournable?"


Lecoutre M.-P., Lecoutre B. (2001) - Other scientific purposes, other methodological ways [Commentary on Hertwig and Ortmann, Experimental practices in economics: A challenge for psychologists]. Behavioral and Brain Sciences, 24, 421.

    Hertwig and Ortmann have made a laudable effort to bring together experimental practices in economics and in psychology. Unfortunately they ignore one of the primary objectives of psychological research which is an analytic description of general cognitive processes. Among experimental practices in probability judgment tasks they discussed, we will focus hereafter on enactment of scripts and repetition of trials.


Lecoutre M.-P., Lecoutre B. (2001) - Comentarios a investigación en educación estadística: Algunas cuestiones prioritarias (Batanero, Garfield, Ottaviani, Truran). Hipótesis alternativa, 2(3), 4‑5.

    Una investigación de calidad en educación estadística debería incorporar tres aspectos complementarios: normativo, descriptivo y prescriptivo. Comentaremos más específicamente la necesidad de un enfoque cognitivo experimental y nuestro interés en dos conceptos: aprendizaje activo y procesamiento analógico.


Poitevineau J., Lecoutre B. (2001) - The interpretation of significance levels by psychological researchers: The .05-cliff effect may be overstated. PsychonomicBulletin and Review, 8, 847-850.

    Comments about previous studies indicate that the interpretation of significance levels by psychological researchers is unequivocally dictated by a binary decision-making framework. In particular confidence in a p level would drop abruptly just beyond the fateful .05 level ("cliff effect"). A replication of Rosenthal and Gaito's experiment on the degree of confidence in p levels shows that these claims should be moderated. Detailed analysis of individual curves reveals that the attitude of researchers towards p -values is far from being as homogeneous as might be expected. However most psychological researchers in our study rated graduated confidence judgments, as either exponential or linear. Only a minority of "all-or-none" respondents exhibited an abrupt drop in confidence.


Lecoutre B., Mabika B., Derzko G. (2002) - Assessment and monitoring in clinical trials when survival curves have distinct shapes in two groups: a Bayesian approach with Weibull modeling. Statistics in Medicine, 21, 663-674

   The comparison of two Weibull distributions with unequal shape parameters, in the case of right censored survival data obtained from independent samples, is considered within the framework of Bayesian statistical methodology. The procedures are illustrated with the example of a mortality study where a new treatement is compared to a placebo. The posterior distributions about relevant parameters, which may provide support for a conclusion of clinical superiority of the treatment, and the predictive distributions, which may guide decisions about early stopping at an interim analyses, are considered for a class of appropriate priors.

Key words:  Bayesian methods; mortality study; Weibull distribution; interim analyses; predictive distributions.


Poitevineau J., Lecoutre B., Lecoutre M.-P., Rovira K. (2002) - Application de la méthode des arbres de similarité additifs de Sattath et Tversky dans une tâche de catégorisation de situations d'incertitude. Cahiers du LCPE, 6, 15-28

    Dans une tâche de catégorisation d'objets, les données à analyser se présentent sous forme d'un ensemble de partitions des objets. A partir de cet ensemble on peut facilement construire une matrice de dissimilarités entre les objets. La méthode des arbres de similarité additifs de Sattath et Tversky (1977) permet de représenter la structure des objets sous la forme d'un arbre (un ensemble de noeuds reliés par des arêtes). Les objets correspondent alors aux noeuds externes (ou feuilles) de l'arbre, et la dissimilarité entre deux objets est représentée par la longueur du chemin qui les joint. Le programme informatique Addtree (dans la version de Barthélemy et Guénoche, 1991) permet de construire ces arbres. Nous illustrerons ici l'utilisation de cette méthode pour analyser les données obtenues dans une tâche de catégorisation de situations d'incertitude par des sujets appartenant à trois groupes se différenciant selon leur degré d'expertise en probabilités. Les représentations par des arbres sont utilisées ici pour faire ressortir la structure des objets et la comparer à une classification théorique a priori. La méthode est également appliquée pour rechercher une classification des sujets à l'intérieur de chacun des groupes.


Lecoutre M.-P., Poitevineau J., Lecoutre B. (2003) - Even statisticians are not immune to misinterpretations of Null Hypothesis Significance Tests. International Journal of Psychology, 38, 37-45.

   We investigated the way experienced users interpret Null Hypothesis Significance Testing (NHST) outcomes. An empirical study was designed to compare the reactions of two populations of NHST users, psychological researchers and professional applied statisticians, when faced with contradictory situations. The subjects were presented with the results of an experiment designed to test the efficacy of a drug by comparing two groups (treatment/placebo). Four situations were constructed by combining the outcome of the t test (significant vs nonsignificant) and the observed difference between the two means d (large vs small). Two of these situations appeared as conflicting (t significant/d small and t nonsignificant/d large). Three fundamental aspects of statistical inference were investigated by means of open questions: drawing inductive conclusions about the magnitude of the true difference from the data in hand, making predictions for future data, and making decisions about stopping the experiment. The subjects were 25 statisticians from pharmaceutical companies in France, subjects well versed in statistics, and 20 psychological researchers from various laboratories in France, all with experience in processing and analyzing experimental data. On the whole, statisticians and psychologists reacted in a similar way and were very impressed by significant results. It must be outlined that professional applied statisticians were not immune to misinterpretations, especially in the case of nonsignificance. However, the interpretations that accustomed users attach to the outcome of NHST can vary from one individual to another, and it is hard to conceive that there could be a consensus in front of seemingly conflicting situations. In fact beyond the superficial report of "erroneous" interpretations, it can be seen in the misuses of NHST intuitive judgmental "adjustments", that try to overcome its inherent shortcomings. These findings encourage the many recent attempts to improve the habitual ways of analyzing and reporting experimental data.

Key words:  Null Hypothesis Significance Testing; statistical inference; inductive reasoning.

Même les statisticiens ne sont pas à l'abri des abus d'interprétation des testsde signification de l'hypothèse nulle

   Nous avons étudié la manière dont des utilisateurs expérimentés interprètent les résultats des Tests de Signification de l'Hypothèse Nulle. Une étude empirique a été menée pour comparer les réactions de deux populations d'utilisateurs, des chercheurs en psychologie et des statisticiens professionnels, face à des situations conflictuelles. On présentait aux sujets les résultats d'une expérience planifiée pour tester l'efficacité d'un médicament en comparant deux groupes (traitement/placebo). Quatre situations étaient construites en combinant l'issue du test t (significatif vs non-significatif) et la différence observée d entre les deux moyennes (grande vs petite). Deux de ces situations apparaissaient conflictuelles (t significatif/d petite et t non-significatif/d grande). Trois aspects fondamentaux de l'inférence statistique étaient examinés au moyen de questions ouvertes: tirer une conclusion inductive sur la grandeur de la vraie différence, faire une prédiction relative à des données futures, et prendre une décision sur l'arrêt de l'expérience. Les sujets étaient 25 statisticiens de l'industrie pharmaceutique en France, donc experts en statistique, et 20 chercheurs en psychologie de différents laboratoires français, ayant tous une expérience de l'analyse des données expérimentales. Dans l'ensemble, les statisticiens et les psychologues se sont comportés d'une manière similaire et ont été très influencés par les résultats significatifs. Un résultat important est que les statisticiens ne sont pas à l'abri des abus d'interprétation des tests, en particulier quand le résultat est non significatif. Cependant l'interprétation des tests peut varier considérablement d'un individu à l'autre et est loin de donner lieu à un consensus face à des situations en apparence conflictuelles. En fait au delà du constat superficiel de l'existence d'interprétations "erronées", on peut voir dans les mésusages des tests des "ajustements" de jugement intuitifs, pour tenter de surmonter leurs insuffisances fondamentales. Ces résultats encouragent les nombreuses tentatives récentes d'améliorer les procédures habituelles pour analyser les données expérimentales et présenter les résultats.


Lecoutre B. (2004) - Expérimentation, inférence statistique et analyse causale. Intellectica, 38, 193-245.

   On se situe dans le cadre de l'analyse causale de données d'expériences "randomisées" (les traitements sont affectés à chaque unité expérimentale par tirage au sort). Les apports de quelques fondateurs de l'inférence statistique sont rapidement examinés. On considère ensuite les travaux récents, et notamment ceux sur les modèles graphiques structuraux de Pearl, qui visent à unifier sous une interprétation unique un certain nombre d'approches, incluant notamment les analyses contrefactuelles, les modèles graphiques, les modèles d'équations structurelles. La plupart de ces travaux reposent sur une approche contrefactuelle (invoquant des résultats potentiels: "si un autre traitement avait été affecté à l'unité expérimentale..." de l'inférence causale. Dans un article provocateur, Dawid (2000) soutient que cette approche est essentiellement métaphysique, et pleine de tentations de faire des inférences qui ne peuvent pas être justifiées sur la base de données empiriques. Concernant plus particulièrement les modèles graphiques structuraux, la critique de Dawid est que les "variables latentes" en jeu dans de tels modèles ne sont pas de véritables variables concomitantes (variables mesurables, qui peuvent être supposées non affectées par le traitement appliqué) et qu'il n'y a alors aucun moyen, même en principe, de vérifier les suppositions ("assomptions") faites - qui affecteront néanmoins les inférences qui en découlent. Dawid qualifie en conséquence ces modèles de pseudo-déterministes et les considère comme non scientifiques. Les différents arguments et les solutions proposées sont examinés et discutés.

Mots-clés:  Analyse de données expérimentales; randomisation; effets individuels; inférence statistique;inférence causale; modèles graphiques structuraux; approche contrefactuelle;variables concomitantes; méthodes bayésiennes.

Experimentation, statistical inference and causal analysis

   The causal analysis of "randomised" experimental data (treatments are randomly assigned to each experimental unit) is considered here. The contributions of some founders of statistical inference are briefly examined. Recent works, and especially Pearl's graphical structural models, are then considered. These models include counterfactual analyses, graphical models, structural equations models. Most of these models are based on a counterfactual approach (involving potential response: "if another treatment had been allocated to the experimental unit...") to causal inference. In a provocative article, Dawid (2000) argues that this approach is essentially metaphysical, and full of temptations to make inferences that cannot be justified on the basis of empirical data. Regarding graphical structural models, Dawid's major criticism is that "latent variables" involved in such models are not genuine concomitant variables (measurable variables, that can be assumed unaffected by the treatment applied) and that there is no way, even in principle, of verifying the assumptions made - which will nevertheless affect the ensuing inferences. Dawid terms these models pseudodeterministic and regards them as unscientific. The arguments and solutions are reviewed and discussed.

Key words:  Experimental data analysis; randomisation; individual effects; statistical inference; causal inference; graphical structural models; counterfactuals; concomitant variables; Bayesian methods.


Lecoutre B., Poitevineau J., Lecoutre M.-P. (2004) - Fisher: Responsible, not guilty. Discussion of D.J. Denis' paper, The modern hypothesis testing hybrid: R. A. Fisher's fading Influence. Journal de la SFdS, 145, 55-62.

When reading Denis' paper the feeling is that Fisher cannot be judged responsible for the "problems associated with today's model". Even if we agree that current uses of NHST are farm from being pure Fisherian, our analysis is somewhat different. In order to understand the Fisher's real contribution, it is of direct importance to recall his statistical ideas about causality and probability. In particular his works, not only on the fiducial theory, but also on the Bayesian method in his last years, are a fundamental counterpart to his emphasis on significance tests. In conclusion, while the Fisher's responsibility in the today's practices cannot be discarded, the verdict imposes oneself: "responsible, not guilty".

La lecture de l'article de Denis donne l'impression que Fisher ne peut pas être jugé responsable des "problèmes associés au modèle d'aujourd'hui". Même si nous sommes d'accord que les usages actuels des tests de signification de l'hypothèse nulle sont loin d'être purement fishériens, notre analyse est sensiblement différente. Pour comprendre la contribution réelle de Fisher, il est essentiel de rappeler ses idées statistiques sur la causalité et la probabilité. En particulier ses travaux, non seulement sur la théorie fiduciaire, mais aussi sur la méthode bayésienne dans ses dernières années, constituent une contrepartie fondamentale à son insistance sur l'usage des tests de signification. En conclusion, tandis que la responsabilité de Fisher dans les pratiques actuelles ne peut pas être rejetée, le verdict s'impose de lui même: "responsable, non coupable".


Lecoutre M.-P., Clément E., Lecoutre B. (2004) - Failure to construct and transfer correct representations across probability problems. Psychological Reports, 94, 151-162.

   Previous studies carried out on "purely random" situations (with dice or poker chips) show the difficulties encountered by people in such situations however simple they may be. In fact, in this type of situation prior knowledge guides spontaneous representations and the "errors" observed could be explained by the activation of "implicit models" which form the basis of erroneous representations. 42 statistically naïve undergraduates were given several variants of a probability problem on which errors are common. In a learnin phase, subjects were given four problems involving geometric figures which were pairwise related by complementary and equivalence relations. In a subsequent transfer phase, they were given a fith problem involving poker chips, which was structurally isomorphic to the fourth geometric-figures problem. The findings show that people do not realize the relations between problems, and that transfer occured only for the subset of subjects who performed correctly on the training problems of the learning phase. These results appear to have some significant implications in teaching mathematical concepts.


Poitevineau J. (2004) - L'usage des tests statistiques par les chercheurs en psychologie: Aspects normatif, descriptif et prescriptif. Mathématiques et Sciences Humaines, 167, 5-25.

   La pratique des tests statistiques par les chercheurs en psychologie est abordée selon trois aspects. Du point de vue normatif les tests apparaissent inadaptés; les principales critiques sont présentées. Du point de vue descriptif, l'examen des manuels statistiques, les réanalyses d'articles publiés et les expériences auprès de chercheurs montrent l'existence de nombreux abus d'utilisation. Enfin, du point de vue prescriptif, des solutions de rechange sont envisagées, en particulier les méthodes bayésiennes qui apparaissent particulièrement prometteuses.

Mots-clés:  Inférence statistique; raisonnement inductif; tests de signification; intervalles de confiance;méthodes bayésiennes; méthodologie.

The use of significance tests by psychologists: normative, descriptive and prescriptive viewpoints

At a normative level, the significance tests appear to be ill-suited and the main criticisms are reported. At a descriptive level, both examination of statistical textbooks, re-analyses of published papers and experiments about the use of significance tests by psychologists clearly reveals many misuses. At a prescriptive level, alternative solutions are considered, especially the Bayesian methods which appear to be especially attractive.

Key words:  Statistical inference; inductive reasoning; significance tests; confidence intervals;Bayesian methods; methodology.


Lecoutre, B. (2005) - Former les étudiants et les chercheurs aux méthodes bayésiennes pour l'analyse des données expérimentales. La Revue de Modulad, 33, 85-107.

   Les tests de signification fréquentistes de l'hypothèse nulle (en anglais "Null Hypothesis Significance Testing" = NHST) font tellement partie des habitudes des scientifiques que l'on ne peut supprimer leur usage "en les jetant par la fenêtre". Face à cette situation, la stratégie proposée pour former les étudiants et les chercheurs aux méthodes d'inférence statistique pour l'analyse des données expérimentales repose sur une transition en douceur vers le paradigme bayésien. Les principes de base de cette stratégie sont les suivants. (1) Présenter les interprétations bayésiennes naturelles des tests de signification usuels pour attirer l'attention sur leurs insuffisances. (2) Créer en conséquence le besoin d'un changement dans la présentation et l'interprétation des résultats. (3) Finalement fournir aux utilisateurs la possibilité réelle de penser de manière raisonnable les problèmes d'inférence statistique et de se comporter d'une façon plus raisonnable. La conclusion est que l'enseignement de l'approche bayésienne dans le contexte de l'analyse des données expérimentales apparaît à la fois désirable et faisable. Cette faisabilité est illustrée pour les méthodes d'analyse de variance.


Lecoutre B., ElQasyr K. (2005) - Play-the-winner rule in clinical trials: models for adaptative designs and Bayesian methods. In Jacques Janssen and Philippe Lenca (Eds.): Applied Stochastic Models and Data Analysis Conference 2005 Proceedings.
Brest: ENST Bretagne, Part X. Health, 1039-1050.

   Adaptative designs for clinical trials that are based on a generalization of the "play-the-winner" rule are considered as an alternative to previously developed models. Theoretical and numerical results show that these designs perform better for the usual criteria. Bayesian methods are proposed for the statistical analysis of these designs.


Lecoutre B., Poitevineau J., Lecoutre M.-P. (2005) - Une raison pour ne pas abandonner les tests de signification de l'hypothèse nulle. La Revue de Modulad, 33, 243-248 / A reason why not to ban Null Hypothesis Significance Tests. La Revue de Modulad, 33, 249-253.

   On montre que l'on peut directement calculer un intervalle pour un contraste entre moyennes, étant donné seulement la valeur observée du contraste et la statistique du test t ou F associé (ou encore, de manière équivalente le seuil observé correspondant ("p-value"). Cet intervalle peut être vu comme un intervalle de confiance fréquentiste ou comme un intervalle de crédibilité bayésien ou comme un intervalle fiduciaire. Cela donne aux utilisateurs des tests de signification usuels la possibilité d'une transition facile vers des pratiques statistiques plus appropriées. On met en avant les liens conceptuels entre les tests et les intervalles de confiance ou de crédibilité.

   It is shown that an interval estimate for a contrast between means can be straightforwardly computed, given only the observed contrast and the associated t or F test statistic (or equivalently the corresponding p-value). This interval can be seen as a frequentist confidence interval, as a standard Bayesian credibility interval, or as a fiducial interval. This interval estimate can be viewed either as a frequentist confidence interval or a fiducial interval or a Bayesian credible interval. This gives Null Hypothesis Significance Tests (NHST) users the possibility of an easy transition towards more appropriate statistical practices. Conceptual links between NHST and interval estimates are outlined.


Bunouf P. (2006)Lois bayésiennes a priori dans un plan binomial séquentiel/Bayesian prior distributions in a binomial sequential design. Thèse de doctorat de mathématique/Doctoral thesis in mathematic, Université de Rouen.

   La reformulation du théorème de Bayes par R. de Cristofaro permet d'intégrer l'information sur le plan expérimental dans la loi a priori. En acceptant de transgresser les principes de vraisemblance et de la règle d'arrêt, un nouveau cadre théorique permet d'aborder le problème de la séquentialité dans l'inférence bayésienne. En considérant que l'information sur le plan expérimental est contenue dans l'information de Fisher, on dérive une famille de lois a priori à partir d'une vraisemblance directement associée à l'échantillonnage. Le cas de l'évaluation d'une proportion dans le contexte d'échantillonnages Binomiaux successifs conduit à considérer la loi Bêta-J. L'étude sur plusieurs plans séquentiels permet d'établir que l'"a priori de Jeffreys corrigé" compense le biais induit sur la proportion observée. Une application dans l'estimation ponctuelle montre le lien entre le paramétrage des lois Bêta-J et Bêta dans l'échantillonnage fixe. La moyenne et le mode des lois a posteriori obtenues présentent des propriétés fréquentistes remarquables. De même, l'intervalle de Jeffreys corrigé montre un taux de recouvrement optimal car la correction vient compenser l'effet de la règle d'arrêt sur les bornes. Enfin, une procédure de test, dont les erreurs s'interprètent à la fois en terme de probabilité bayésienne de l'hypothèse et de risques fréquentistes, est construite avec une règle d'arrêt et de rejet de H0 fondée sur une valeur limite du facteur de Bayes. On montre comment l'a priori de Jeffreys corrigé compense le rapport des évidences et garantit l'unicité des solutions, y compris lorsque l'hypothèse nulle est composite.

Mots-clés: Principe de vraisemblance; règle d'arrêt; plan Binomial séquentiel; information de Fisher; inférence bayésienne; propriétés fréquentistes; principe de translation de la vraisemblance; rincipe d'impartialité du plan expérimental; règle de Jeffreys; estimation ponctuelle; intervalle de confiance; test d'hypothèse; facteur de Bayes; principe d'égalité aux bornes

Bayesian prior distributions in a binomial sequential design

   The reformulation by R. de Cristofaro of the Bayes theorem allows to integrate the information on the experimental design in the prior distribution. In accepting to transgress the Likelihood and Stopping Rules principles, a new framework allows to move on the issue of sequenciality in the Bayesian inference. Considering that the information on the design is contained in the Fisher information, a new family of priors is derived from a likelihood directly related to the sampling rule. The case of the study of a proportion in the sequential context of successive Binomial samplings leads to consider the Beta-J distribution. The study on several sequential designs allows to state that the "corrected Jeffreys prior" compensates the bias induced on the observed proportion. An application in the estimation shows the relationship between the parameters of the Beta-J and Beta distributions in the fixed sampling. The mean and mode of the posterior distributions show remarkable frequentist properties. As well, the corrected Jeffreys interval has an optimal covering rates as the correction compensates the effect of stopping rule on the limits. Last, a test procedure, whose the errors are interpreted in terms of both bayesian probabilities of hypotheses and frequentist risks, is designed with a rule for stopping and rejecting H0 based on a limit value of the Bayes factor. It is shown how the corrected Jeffreys prior compensates the ratio of evidences and guarantees the unicity of solutions, even when the null hypothesis is composite.

Keywords: Likelihood principle; stopping rule; sequential binomial design; Fisher information; Bayesian inference; frequentist properties; likelihood translation principle; impartiality of the design principle; Jeffreys rule; point estimation; confidence interval; hypothesis test; Bayes factor de Bayes; equality at bounds principle


Bunouf P, Lecoutre B. (2006) - Bayesian priors in sequential binomial design. Comptes Rendus de L'Académie des Sciences Paris, Série I, 343, 339–344.

   The status of sequential analysis in Bayesian inference is revisited. The information on the experimental design, including the stopping rule, is one part of the evidence, prior to the sampling. Consequently this information must be incorporated in the prior distribution. This approach allows to relax the likelihood principle when appropriate. It is illustrated in the case of successive Binomial trials. Using Jeffreys' rule, a prior based on the Fisher information and conditional on the design characteristics is derived. The corrected Jeffreys prior, which involves a new distribution called Beta-J, extends the classical Jeffreys priors for the Binomial and Pascal sampling models to more general stopping rules. As an illustration, we show that the correction induced on the posterior is proportional to the bias induced by the stopping rule on the maximum likelihood estimator.

A priori bayésiens dans un échantillonnage binomial séquentiel.

    Le statut des analyses séquentielles dans l'inférence bayésienne est reconsidéré. L'information sur le plan expérimental, incluant la règle d'arrêt, constitue une partie de l'évidence, antérieure à l'échantillon. Par conséquent cette information doit être intégrée dans la loi a priori. Cette approche permet de renoncer au principe de vraisemblance quand cela est approprié. Elle est illustrée dans le cas d'échantillons binomiaux successifs. En utilisant la règle de Jeffreys, une loi a priori basée sur l'information de Fisher et conditionnelle aux caractéristiques du plan expérimental est dérivée. L'a priori de Jeffreys corrigé, qui met en jeu une nouvelle distribution appelée Bêta-J, étend les a priori de Jeffreys classiques dans l'échantillonnage binomial et l'échantillonnage de Pascal à des règles d'arrêt plus générales. A titre d'illustration, nous montrons que la correction induite sur la loi a posteriori est proportionnelle au biais induit sur l'estimateur du maximum de vraisemblance.


Lecoutre B. (2006) - Training students and researchers in Bayesian methods for experimental data analysis. Journal of Data Science, 4, 207-232.

   The use of frequentist Null Hypothesis Significance Testing (NHST) is so an integral part of scientists' behavior that its uses cannot be discontinued by flinging it out of the window. Faced with this situation, the suggested strategy for training students and researchers in statistical methods for experimental data analysis involves a smooth transition towards the Bayesian paradigm. Its general outlines are as follows. (1) To present natural Bayesian interpretations of NHST outcomes to draw attention to their shortcomings. (2) To create as a result of this the need for a change of emphasis in the presentation and interpretation of results. (3) Finally to equip users with a real possibility of thinking sensibly about statistical inference problems and behaving in a more reasonable manner. The conclusion is that teaching the Bayesian approach in the context of experimental data analysis appears both desirable and feasible. This feasibility is illustrated for analysis of variance methods.


Lecoutre B. (2006) - Tutoriel: L'inférence bayésienne pour l'analyse des données expérimentales. La Revue de Modulad, 35, 130-219.

Ce tutoriel se situe dans la ligne des articles précédemment publiés dans la Revue de Modulad : Lecoutre (1996b, 2005/1997, 2005) ; Lecoutre, Poitevineau & Lecoutre (2005). Il s'appuie sur l'utilisation de programmes informatiques qui ont également fait l'objet d'une présentation dans un numéro précédent (Lecoutre & Poitevineau, 2005). La motivation de ce tutoriel est avant tout méthodologique, et le choix du cadre bayésien ne devrait pas paraître idéologique. Plus précisément, l'objectif est d'apporter aux questions essentielles soulev´ees par l'analyse des données expérimentales des réponses mieux adaptées que les tests de signification de l'hypothèse nulle. Basées sur des définitions opérationnelles plus utiles que les procédures traditionnelles (tests, intervalles de confiance), les méthodes bayésiennes offrent une souplesse considérable, en rendant tous les choix explicites. De plus, la philosophie bayésienne met en avant la nécessité de réfléchir sur l'information fournie par les données disponibles - "qu'est-ce que les données ont à dire?" - au lieu d'appliquer des procédures rituelles. Des procédures bayésiennes de routine sont désormais faciles à mettre en oeuvre pour toutes les situations courantes. Leurs résultats peuvent être présentés sous une forme intuitivement séduisante et facilement interprétable. Elles ouvrent une nouvelle voie prometteuse dans la méthodologie statistique


Lecoutre B. (2006) - Isn't everyone a Bayesian? Indian Bayesian Society News Letter, III, 3-9.

The literature is full of Bayesian interpretations of frequentist p-values and confidence levels. Even experienced users and experts in statistics are not immune from conceptual confusions. All the attempts to rectify these interpretations have been a loosing battle. Consequently we automatically ask ourselves: "isn't everyone a Bayesian?"


Lecoutre B. (2006) - And if you were a Bayesian without knowing it? In A. Mohammad-Djafari (Ed.), 26th Workshop on Bayesian Inference and Maximum Entropy Methods in Science and Engineering. Melville : AIP Conference Proceedings Vol. 872, 15-22.

The literature is full of Bayesian interpretations of frequentist p-values and confidence levels. All the attempts to rectify these interpretations have been a loosing battle. In fact such interpretations suggest that most users are likely to be Bayesian "without knowing it" and really want to make a different kind of inference.


Lecoutre B. (2006) - How to get 1-alpha confidence level from 1-2alpha confidence intervals. Submitted for publication.

   For assessing the smallness an ANOVA effect, the 1-2alpha usual confidence interval recommended by Steiger [Steiger, J. H. - Beyond the F test: Effect size confidence intervals and tests of close fit in the analysis of variance and contrast analysis. Psychological Methods, 2004, 9, 164-182] and its generalization, the 1-2alpha Sheffé simultaneous interval estimate, have to be extended in a simple suitable way in order to give "exact" 1-alpha confidence intervals.


Lecoutre M.-P., Rovira K., Lecoutre B., Poitevineau J. (2006) - People's intuitions about randomness and probability: An empirical study. Statistics Education Research Journal, 5(1), 20-35.

   What people - students as well as instructors - mean by randomness should be taken into account when teaching statistical inference. An experiment was designed to explore subjective beliefs about randomness and probability through two successive categorization tasks. Subjects were asked to categorize 16 familiar items: 8 real items from everyday life experiences, and 8 stochastic items involving a repeatable process. Three groups of subjects differing according to their background knowledge of probability theory were compared: 20 pupils in the last class of lower secondary school; 20 researchers in psychology, and 20 researchers in mathematics. While our study has confirmed the wide range of meanings that individuals attach to the notion of randomness, it has been possible to distinguish some general conceptions of randomness. Background knowledge of probability theory has little effect on spontaneous views on randomness. An important finding is that the arguments used to judge if an event is random and those to judge if it is not random appear to be of different natures. While the concept of probability has been introduced to formalize randomness ("randomness implies probability"), a majority of individuals appeared to consider probability as a primary concept ("probability implies randomness").


Poitevineau J., Lecoutre B. (2006) - Computing Bayesian predictive distributions: The K-square and K-prime distributions. http://hal.archives-ouvertes.fr/hal-00113705, 1-13.

   The computation of two Bayesian predictive distributions which are discrete mixtures of incomplete beta functions is considered. The number of iterations can easily become large for these distributions and thus, the accuracy of the result can be questionable. Therefore, existing algorithms for that class of mixtures are improved by introducing round-off error calculation into the stopping rule. A further simple modification is proposed to deal with possible underflows that may prevent recurrence to work properly


Grouin J.-M., Coste M., Bunouf P., Lecoutre B. (2007) - Bayesian sample size determination in non-sequential clinical trials: Statistical aspects and some regulatory considerations? Statistics in Medicine, 26, 4914-4924.

   The most common Bayesian methods for sample size determination (SSD) are reviewed in the non-sequential context of a confirmatory phase III trial in drug development. After recalling the regulatory viewpoint on SSD, we discuss the relevance of the various priors applied to the planning of clinical trials. We then investigate whether these Bayesian methods could compete with the usual frequentist approach to SSD and be considered as acceptable from a regulatory viewpoint.


Lecoutre B. (2007) - Another look at confidence intervals for the noncentral t distribution. Journal of Modern Applied Statistical Methods, 6(1), 155-164.

   An alternative approach to the computation of confidence intervals for the noncentrality parameter of the Noncentral t distribution is proposed. It involves the percent points of a statistical distribution. This conceptual improvement renders the technical process for deriving the limits more comprehensible. Accurate approximations can be derived and easily used.


Lecoutre B., Faure S. (2007) - A note on new confidence intervals for the difference between two proportions based on an Edgeworth expansion. Journal of Statistical Planning and Inference, 137, 355-356.

   Zhou and Qin [2004. New intervals for the difference between two independent binomial proportions. J. Statist. Plann. Inference 123, 97-115, 2005. A new confidence interval for the difference between two binomial proportions of paired data. J. Statist. Plann. Inference 128, 527-542] "new confidence intervals" for the difference between two treatment proportions exhibit a severe lack of invariance property that is a compelling reason not to use them.


Bunouf P., Lecoutre B. (2008) - On Bayesian estimators in multistage binomial designs. Journal of Statistical Planning and Inference, 138, 3915-3926.

   A new class of Bayesian estimators for a proportion in multistage binomial designs is considered. Priors belong to the beta-J distribution family, which is derived from the Fisher information associated with the design. The transposition of the beta parameters of the Haldane and the uniform priors in fixed binomial experiments into the beta-J distribution yields bias-corrected versions of these priors in multistage designs. We show that the estimator of the posterior mean based on the corrected Haldane prior and the estimator of the posterior mode based on the corrected uniform prior have good frequentist properties. An easy-to-use approximation of the estimator of the posterior mode is provided. The new Bayesian estimators are compared to Whitehead's and the uniformly minimum variance estimators through several multistage designs. Last, the bias of the estimator of the posterior mode is derived for a particular case.


ElQasyr K. (2008)Modélisation et analyse statistique des plans d'expérience séquentiels. Thèse de doctorat de mathématique, Université de Rouen.

   Cette thèse est composée de deux parties. La première partie porte sur l'étude de plans d'expérience séquentiels appliqués aux essais cliniques. Nous étudions la modélisation de ces plans. Nous développons une généralisation de la règle "Play-The-Winner". Des résultats théoriques et numériques montrent que cette généralisation conduit à des plans plus performants que les plans qui ont été récemment développés, dans le cadre des modèles d'urne de Freedman, et qui sont une généralisation de de la règle "Play-The-Winner randomisée" ou d'une version modifiée de cette règle. Dans la deuxième partie, nous développons des méthodes d'inférence pour analyser les données des différents plans séquentiels considérés. dans le cas de deux traitements, et pour la règle "play-the-winner", nous explicitons les distributions d'échantillonnage et leurs moments factoriels. Nous en dérivons des procédures d'inférence fréquentistes (tests et intervalles de confiance conditionnels notamment) et bayésiennes non informatives. Dans le cadre bayésien, pour une classe de lois a priori convenablement choisie, sont dérivées explicitement les distributions a posteriori et les intervalles de crédibilité des paramètres d'intérêt, ainsi que les distributions prédictives. Le lien entre les tests conditionnels et les procédures bayésiennes est explicité. Les méthodes bayésiennes sont généralisées pour traiter des plans plus complexes (plusieurs traitements et/ou prise en compte de réponses différées). Des simulations montrent que les propriétés fréquentistes des procédures bayésiennes non informatives sont remarquables.

Mots-clés:  Plans séquentiels, Règle "Play-The-Winner", Modèles d'urne de Feedman, Méthodes bayésiennes, Essais cliniques.


Lecoutre B. (2008) - Bayesian methods for experimental data analysis. Handbook of statistics: Epidemiology and Medical Statistics (Vol 27), Amsterdam: Elsevier, 778-817.

    This chapter introduces the conceptual basis of the objective Bayesian approach to experimental data analysis and reviews some of its methodological improvements. The presentation is essentially non-technical and, within this perspective, restricted to relatively simple situations of inference about proportions. Bayesian computations and softwares are also briefly reviewed and some further topics are introduced.


Lecoutre B., ElQasyr K. (2008) - Adaptative designs for multi-arm clinical trials: The play-the-winner rule revisited. Communications in Statistics - Simulation and Computation, 37, 590-601.

   Adaptative designs for clinical trials that are based on a generalization of the "play-the-winner" rule are considered as an alternative to previously developed models. Theoretical and numerical results show that these designs perform better for the usual criteria. Bayesian methods are proposed for the statistical analysis of these designs.


ElQasyr K., Lecoutre B. (2009) - Comparing two success rates with Play-The-Winner designs. http://hal.archives-ouvertes.fr/hal-00422985

   Explicit formulae for the sampling distribution of Play-the-Winner designs are given. These formulae involve familiar and easy-to-compute distributions. Two examples of applications are given. First, conditional test and confidence interval procedures for PW designs are developed. Second, the Bayesian predictive distributions associated with conjugate independent Beta priors are derived. Moreover, the correspondance between Bayesian posterior distributions and conditional tests is made explicit.


Jhean-Larose S., Denhière G., Lecoutre B. (2009) - Étude développementale de l'interprétation de combinaisons conceptuelles nominales «Relation» et «Propriété». Psychologie Française, 54, 121-135.

    Cette recherche étudie l'interprétation des combinaisons conceptuelles nominales. L'ordre de présentation des constituants de deux types de combinaisons, Relation et Propriété, est manipulé afin d'étudier l'évolution des interprétations Propriété ou Relation en fonction de l'âge. Trois groupes d'enfants (6, 8 et 10 ans) et un groupe d'adultes ont participé à une épreuve de production d'interprétations. Les résultats indiquent que chez les enfants, les interprétations Propriété augmentent avec l'âge mais les interprétations Relation sont majoritaires pour les deux types de combinaisons, alors que chez les adultes, les interprétations Relation sont minoritaires pour les combinaisons Propriété. Chez les enfants et les adultes, les interprétations les plus fréquentes vont dans le sens Nom Principal -> Modificateur, ordre inverse à celui constaté en anglais.

   The present research addresses how people interpret novel noun-noun conceptual combinations. First, we focused on two types of conceptual combinations: property and relational combinations. Secondly, we manipulated the order of the constituents. Finally, we studied if the interpretation in terms of “Property” or “Relation” changes along with age. So, four groups of 6 ; 8 and 10 year-old children and adults participated in a production task. Our results indicated that the interpretations in terms of relation were more frequent for the “Relation” combinations compared to the “Property” ones. Property-transferring interpretations increased with age when Property combinations are presented. The most frequent interpretations followed the order Head noun – Modifier, which is opposite to the order observed in English.


Bunouf P., Lecoutre B. (2010) - An objective Bayesian approach to multistage hypothesis testing. Sequential Analysis, 29, 88-101.

   A new Bayesian approach to multistage hypothesis testing is considered. Prior is derived using Jeffreys' criterion on likelihood associated with the design information. We show that the prior for sequential Bernoulli design asymptotically converges toward the Jeffreys prior in Pascal sampling model. A general rule is given for determining the design-corrected version of default priors when Jeffreys' criterion results in improper distribution. Based on the principle of design impartiality, the Bayes factor as posterior-based evidential measure can be generalized to multistage testing, so that the decision boundaries reflect equal evidence for hypotheses over stages. Effect of prior correction on design parameters and on Bayesian inference upon test termination is studied. The approach is applied to a three-stage binomial design. Last, the use of the prior as the default objective choice in multistage hypothesis testing is discussed.


De Cristofaro R., Lecoutre B. (2010) - A new criterion for prior probabilities. Unpublished work, hal.archives ouvertes.

   Howson and Urbach (1996) wrote a carefully structured book supporting the Bayesian view of scientific reasoning, which includes an unfavorable judgment about the so-called objective Bayesian inference. In this paper, the theses of the book are investigated from Carnap's analytical viewpoint in the light of a new formulation of the Principle of Indi erence. In particular, the paper contests the thesis according to which no theory can adequately represent 'ignorance' between alternatives. Beginning from the new formulation of the principle, a criterion for the choice of an objective prior is suggested in the paper together with an illustration for the case of Binomial sampling. In particular, it will be shown that the new prior provides better frequentist properties than the Jeffreys interval.


Lecoutre B., Derzko G., ElQasyr K. (2010) - Frequentist performance of Bayesian inference with response-adaptive designs. Statistics in Medicine, 29, 3219-3231.

   In controlled clinical trials, where minimizing treatment failures is crucial, response-adaptive designs are attractive competitors to 1:1 randomized designs for comparing the success rates φ1 and φ2 of two treatments. In these designs each new treatment assignment depends on previous outcomes through some predefined rule. Here Play-The-Winner, Randomized Play-The-Winner, Drop-The-Loser, Generalized Drop-the-Loser and Doubly-adaptive Biased Coin Designs are considered for new treatment assignments. As frequentist inference relies on complex sampling distributions in those designs, we investigate how Bayesian inference, based on two independent Beta prior distributions, performs from a frequentist point-of-view. Performance is assessed through coverage probabilities of interval estimation procedures, power and minimization of failure count. It is shown that Bayesian inference can be favorably compared to frequentist procedures where the latter are available. The power of response-adaptive designs is generally very close to the power of 1:1 randomized design. However, failure count savings are generally small, except for the Play-the-Winner and Doubly-adaptive Biased Coin designs in particular ranges of the true success rates. The Randomized Play-the-Winner assignment rule has the worst performance, while Play-the-Winner, Generalized Drop-the-Loser or Doubly-adaptive Biased Coin Designs may outperform other designs depending on different particular ranges of the true success rates.


Lecoutre B., Killeen P. (2010) - Replication is not coincidence: Reply to Iverson, Lee, and Wagenmakers (2009). Psychonomic Bulletin & Review, 17, 263-269.

   Iverson, Lee and Wagenmakers (2009) claimed that Killeen's (2005) statistic prep overestimates the "true probability of replication". We show that Iverson et al. confused the probability of replication of an observed direction of effect with a probability of coincidence — the probability that two future experiments will return the same sign. The theoretical analysis is punctuated with a simulation of the predictions of prep for a realistic random effects world of representative parameters, when those are unknown a priori. We emphasize throughout that prep is intended to evaluate the probability of a replication outcome after observations, not to estimate a parameter. Hence, the usual conventional criteria (unbiasedness, minimum variance estimator) for judging estimators are not appropriate for probabilities such as p and prep.


Lecoutre B., Lecoutre M.-P., Poitevineau J. (2010) - Killeen's probability of replication and predictive probabilities: How to compute, use and interpret them. Psychological Methods, 15, 158-171.

   P. R. Killeen's (2005a) [Killeen, P. R. - An alternative to null-hypothesis significance tests, Psychological Science, 2005, 16, 345–353] probability of replication (prep) of an experimental result is the fiducial Bayesian predictive probability of finding a same-sign effect in a replication of an experiment. prep is now routinely reported in Psychological Science and has also begun to appear in other journals. However, there is little concrete, practical guidance for use of prep and the procedure has not received the scrutiny that it deserves. Furthermore, only a solution that assumes a known variance has been implemented. A practical problem with prep is identified: in many articles prep appears to be incorrectly computed, due to the confusion between 1-tailed and 2-tailed p-values. Experimental findings reveal the risk of misinterpreting prep as the predictive probability of finding a same-sign and significant effect in a replication (psrep). Conceptual and practical guidelines are given to avoid these pitfalls. They include the extension to the case of unknown variance. Moreover, other uses of fiducial Bayesian predictive probabilities, for analyzing, designing ("how many subjects?") and monitoring ("when to stop?") experiments, are presented. Concluding remarks emphasize the role of predictive procedures in statistical methodology.


Poitevineau J., Lecoutre B. (2010) - Implementing Bayesian predictive procedures: The K-prime and K-square distributions. Computational Statistics & Data Analysis, 54, 723-730.

   The aim of this article is to contribute to implement Bayesian predictive procedures under standard normal models. Two distributions are of particular interest, the K-prime and K-square distributions. They also give exact inferences for simple and multiple correlation coefficients. Their cumulative distribution functions can be expressed in terms of infinite series of multiples of incomplete beta function ratios, thus adequate for recursive calculations. Efficient algorithms are provided. To deal with special cases where possible underflows may prevent recurrence to work properly, a simple solution is proposed which results in a procedure which is intermediate between two classes of algorithms. Some examples of applications are given.


Rovira K., Lecoutre M.-P., Lecoutre B., Poitevineau J. (2010) - Catégorisation de situations d'incertitude et variabilité des points de vue sur le hasard. Bulletin de Psychologie, 63, 69-80.

   Afin d'aborder la variabilité des points de vue, dans des situations d'incertitude, une analyse individuelle des classifications et des termes utilisés dans les justifications, en fonction du type de catégorisation (libre ou contrainte), du type d'items (réels ou stochastiques) et du degré d'expertise en probabilités (élèves en classe de 3e, enseignants-chercheurs en psychologie et enseignants-chercheurs en mathématiques), a été menée. Cette analyse révèle l'existence d'un savoir de sens commun, lié aux expériences quotidiennes, partagées par les membres d'une même communauté linguistique. Cependant, l'expertise entraîne des contextualisations différentes et l'utilisation de savoirs liés à des pratiques spécifiques. En outre, quel que soit le niveau d'expertise, il apparaît qu'un même sujet peut concevoir différemment le hasard, en fonction du type d'items et de l'objectif de la tâche. Le concept de hasard apparaît, donc, comme multiple et ancré dans les pratiques des individus.

   To address the variability of viewpoints faced with uncertainty, we have carried out an individual analysis of classifications and terms used to justify a type of categorisation (free or constrained), the type of items (real or stochastic), and the degree of expertise in probability theory (4th year high school pupils, university teachers in psychology and mathematics). This analysis reveals the existence of common-sense knowledge related by the daily experiences shared by members of the same linguistic community. Expertise, however, leads to different contextualisations, and using knowledge related to specific practices. Regardless of the knowledge level the same subject can conceive chance differently as a function of the type of items and the goal of the task. The concept of random appears to be multiple, and rooted in the practices of the individuals.


Rovira K., Lecoutre M.-P., Lecoutre B., Poitevineau J. (2010) - Catégorisation de situations d'incertitude et variabilité des points de vue sur le hasard. Bulletin de Psychologie, 63, 69-80.

   Afin d'aborder la variabilité des points de vue, dans des situations d'incertitude, une analyse individuelle des classifications et des termes utilisés dans les justifications, en fonction du type de catégorisation (libre ou contrainte), du type d'items (réels ou stochastiques) et du degré d'expertise en probabilités (élèves en classe de 3e, enseignants-chercheurs en psychologie et enseignants-chercheurs en mathématiques), a été menée. Cette analyse révèle l'existence d'un savoir de sens commun, lié aux expériences quotidiennes, partagées par les membres d'une même communauté linguistique. Cependant, l'expertise entraîne des contextualisations différentes et l'utilisation de savoirs liés à des pratiques spécifiques. En outre, quel que soit le niveau d'expertise, il apparaît qu'un même sujet peut concevoir différemment le hasard, en fonction du type d'items et de l'objectif de la tâche. Le concept de hasard apparaît, donc, comme multiple et ancré dans les pratiques des individus.

   To address the variability of viewpoints faced with uncertainty, we have carried out an individual analysis of classifications and terms used to justify a type of categorisation (free or constrained), the type of items (real or stochastic), and the degree of expertise in probability theory (4th year high school pupils, university teachers in psychology and mathematics). This analysis reveals the existence of common-sense knowledge related by the daily experiences shared by members of the same linguistic community. Expertise, however, leads to different contextualisations, and using knowledge related to specific practices. Regardless of the knowledge level the same subject can conceive chance differently as a function of the type of items and the goal of the task. The concept of random appears to be multiple, and rooted in the practices of the individuals.


Jhean-Larose S., Lecoutre B., Denhière G. (2011) - From production to selection of interpretations for novel conceptual combinations: A developmental approach. Acta Linguistica Hungarica, 58, 391-416.

   This study looks at how combinations of two French nouns are interpreted. The order of occurrence of the constituents of two types of conceptual combinations, relation and property, was manipulated in view of determining how property-based and relation-based interpretations evolve with age. Three groups of French-speaking children (ages 6, 8, and 10) and a group of adults performed an interpretation-selection task. The results for the children indicated that while property-based interpretations increased with age, relation-based interpretations were in the majority for both combination types, whereas for the adults, relation-based interpretations were in the minority for property combinations. For the children and adults alike, the most frequent interpretations were ones in which the head noun came first and was followed by the modifier (the opposite of the order observed for English).


Lecoutre B., Derzko G. (2011) - Comparing performances of several response-adaptive designs in dose finding studies. Unpublished work, hal.archives ouvertes.

   The main objectives of dose-finding studies are (i) to select the best dose(s) for future phase 3 and/or (ii) to evaluate the dose-response relationship. At that phase 2B stage of the drug develop- ment, little is known about the drug's efficacy, and only a small- to moderate-size sample can be experimented. Response-Adaptive (RA) designs, where the dose allocation to new patients depends on the information got from previous allocations and responses, do match dose-finding study con- ditions well. Therefore one can wonder whether they are valuable alternative designs to Balanced Randomization (BR) designs to meet the above-mentionned dose-finding objectives. Here the operating characteristics and the capability of selecting the best dose(s) and of detecting pre-specified dose contrasts are compared in four multiple dose RA designs namely two Play-the-Winner type, Generalized Drop-the-Loser and Doubly-adaptive Biased Coin designs. The restriction of these designs to two treatments have been shown to be the best choices indeed, as well as the Bayesian procedure used here for inference. The critical concept of target allocation rule is elaborated, and made explicit to match the specific dose-finding objectives. It is shown that the studied RA designs are efficient competitors to BR designs, but none of them outperforms the others on all purposes. Directions for RA design selection are given to experimenters, depending on the primary objective of their planned dose-finding study.


Lecoutre B., Poitevineau G. (2012) - New results for computing exact confidence intervals for one parameter discrete distributions. Unpublished work, hal.archives ouvertes.

   The authors state new general results for computing exact confidence interval limits for usual one-parameter discrete distributions. Specific results for implementing an accurate and fast algorithm are made explicit for the binomial, negative binomial, Poisson and hypergeometric model.

   Les auteurs établissent de nouveaux résultats généraux pour calculer les limites d'un intervalle de confiance exact pour les distributions discrètes à un paramètre usuelles. Des résultats spécifiques pour implémenter un algorithme précis et rapide sont explicités pour les modèles binomial, binomial négatif, de Poisson.


Lecoutre B., Derzko G. (2014) - Tester les nouveaux medicaments: Les statisticiens et la réglementation. Statistique et Société, 2, 61-67.

   Le développement de nouveaux médicaments par l'industrie pharmaceutique fait apparaître des questions statistiques spécifiques dont les réponses doivent obéir à un cadre réglementaire. Ainsi la Conférence Internationale d'Harmonisation, qui réunit les autorités réglementaires et l'industrie pharmaceutique de l'Europe, du Japon et des Etats-Unis, a rédigé en 1999 des lignes directrices («guidelines») qui fournissent les principes statistiques à suivre dans un essai clinique. Ces lignes directrices reposent sur plusieurs points de vue théoriques pas toujours concordants, et de ce fait peuvent entraîner des difficultés conceptuelles pour les utilisateurs, et des difficultés théoriques pour les statisticiens.


Lecoutre B., Poitevineau J. (2014)The Significance Test Controversy Revisited: The Fiducial Bayesian Alternative. Ouvrage à paraître.

Plan of the Book We are conscious that warnings about common misconceptions and unsound statistical practices have been given many times before, apparently without much effect. Our ambition is not only to revisit the "significance test controversy", but also to provide a conceptually sounder alternative. Thus the presentation will be methodologically oriented. The book is organized as follows. Chapter 2 serves as an overall introduction to statistical inference concepts. The basic notions about the frequentist and Bayesian approaches to inference are presented and the corresponding terminology is introduced. Chapter 3 presents normative aspects: the three main wiews of statistical tests – Fisherian, Neyman- Pearsonian and Jeffreys" Bayesian – are discussed. Chapters 4 and 5 are devoted to descriptive aspects: what is the current practice in experimental research? The misuses of null hypothesis significance tests are reconsidered in the light of Jeffreys' Bayesian conceptions about the role of statistical inference in experimental investigations. Chapters 6 and 7 examine prescriptive aspects: what are the recommended "good statistical procedures?" The effect size and confidence interval reporting practices are discussed. The risks of misuses and misinterpretations of the usual ANOVA ES indicators (Cohen's d, eta-squared, etc.) are stressed. Frequentist confidence intervals commonly proposed for these indicators are also seriously questioned. Chapter 8 introduces basic routine procedures for inference about means and demonstrates that the fiducial Bayesian paradigm is appropriate to report experimental results: don't worry, be Bayesian. Of course, this does not mean that by adopting the Bayesian approach one could actually "stop thinking about data". This is not our message: the opposite is actually true! Chapter 9 generalizes the basic procedures to the usual unstandardized and standardized ANOVA effect sizes indicators. Then methodological aspects are discussed and appropriate alternatives to these indicators are developed.

Plan du livre Notre ambition est non seulement de "revisiter" la "significance test controversy", mais aussi de fournir une approche alternative mieux appropriée. En conséquence la présentation est surtout méthodologique. Le chapitre 2 fournit une introduction générale aux concepts de l'inférence statistique. Les notions de base des approches fréquentistes et bayésiennes sont présentées et la terminologie correspondante est introduite. Le chapitre 3 présente les aspects normatifs: les trois conceptions principales du test statistique – Fishérienne, Neyman-Pearsonienne et bayésienne de Jeffreys – sont discutées. Les chapitres 4 et 5 sont consacrés aux aspects descriptifs: quelle est la pratique actuelle dans la recherche expérimentale? Les mauvais usages de tests d'hypothèse nulle sont reconsidérés à la lumière des conceptions bayésiennes de Jeffreys sur le rôle de l'inférence statistique dans les études expérimentales. Les chapitres 6 et 7 examinent les aspects prescriptifs: quelles sont les "bonnes procédures statistiques" recommandées ? Les pratiques concernant l'tilisation des indicateurs d'effets et l'intervalle de confiance sont discutées. Les risques de mauvais usages et d'interprétations erronées des indicateurs d'effets usuels en analyse de variance (d de Cohen, eta-deux, etc.) sont mises en avant. Les intervalles de confiance fréquentistes habituellement proposes pour ces indicateurs sont aussi remis en question. Le chapitre 8 introduit les procédures de routine de base pour l'inférence sur des moyennes et démontrent que le paradigme fiducio-bayésien est approprié pour rapporter les résultats expérimentaux: "don't worry, be Bayesian." Naturellement cela ne signifie pas qu'en adoptant l'approche bayésienne ont pourrait "arrêter de réfléchir sur les données". Ce n'est pas notre message: c'est tout le contraire! Le chapitre 9 généralise les procédures de base aux indicateurs d'effets usuels, non standardisés et standardisés, de l'analyse de variance. Puis les aspects méthodologiques ont discutés et des solutions alternatives à ces indicateurs appropriées sont développées. L'objectif est de fournir au lecteur des procédures appropriées pour surmonter les mauvais usages communs de tests de signification.


Lecoutre B. (2016) - Pourquoi les méthodes bayésiennes sont-elles si peu utilisées dans les publications expérimentales? In I. Drouet (éd) Le bayésianisme aujourd'hui: Fondements et pratiques.
Paris: Editions Matériologiques, 193-219.

   Les publications expérimentales font un usage abondant des procédures d’inférence statistique. En psychologie, par exemple, il n’est pas rare de trouver dans un même article plusieurs dizaines de tests de signification de l’hypothèse nulle. Suivant les recommandations d’un nombre croissant de revues, l’usage des intervalles de confiance fréquentistes se répand également. En revanche les méthodes bayésiennes ne sont guère utilisées. Nous examinons les raisons possibles de cet état de fait. Nous discutons notamment les conceptions (généralement ignorées) de Jeffreys vis-à-vis de l’utilisation des méthodes bayésiennes dans le cas particulier de l’analyse des données expérimentales et nous en tirons les leçons. Notre objectif premier est d’essayer de faciliter le dialogue entre les tenants de l’approche bayésienne et ceux qui analysent des données expérimentales.

   Statistical inference procedures are very extensively used in experimental publications. In psychology, for instance, it is not unusual to find in a single article several tens of null hypothesis significance tests. According to the guidelines of an increasing number of reviews, the use of frequentist confidence intervals is becoming more widely used. In contrast, Bayesian methods are hardly used. We consider the possible reasons for this state of affairs. We especially discuss the (largely ignored) Jeffreys conceptions about the use of Bayesian methods in the specific case of experimental data analysis, and we learn the lessons from them. Our primary goal is to attempt to facilitate dialogue between Bayesian proponents and experimental data analysts.


Lecoutre B., Poitevineau J. (2016) - New results for computing Blaker's exact confidence interval for one parameter discrete distributions. Communication in Statistics- Simulation and Computation, 45, 1041-1053.

The authors state new general results for computing Blaker's exact confidence interval limits for usual one-parameter discrete distributions. Specific results for implementing an accurate and fast algorithm are made explicit for the binomial, negative binomial, Poisson and hypergeometric model.


1982
1983
1984
1985
1986
1988
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2014
2016




http://herisson.nom.fr/: SITE DEDIE AUX HERISSONS...