Известия вузов. Ядерная энергетика

Рецензируемый научно-технический журнал. ISSN: 0204-3327

Сравнение гистограмм в физических исследованиях

28.03.2016 2016 - №01 Моделирование процессов в объектах ядерной энергетики

С.И. Битюков А.В. Максимушкина В.В. Смирнова

DOI: https://doi.org/10.26583/npe.2016.1.09

УДК: 53.088, 519.23

Рассмотрены основные подходы к методам сравнения гистограмм в физических исследованиях. Слово «гистограмма» впервые использовано знаменитым статистиком К. Пирсоном как «обобщенная форма графического представления» [1]. Гистограммы весьма полезны в этом их каноническом применении для визуализации данных. Однако сегодня гистограммы часто рассматривают как чисто математический объект. Гистограммы стали необходимым инструментом в различных предметных областях. Помимо научного анализа данных в экспериментальных исследованиях гистограммы играют важную роль в сопровождении баз данных, обработке изображений и компьютерном «зрении» [1]. Соответственно, цели и методы обработки гистограмм меняются в зависимости от области применения. В данной работе гистограммы рассматриваются как один из элементов системы обработки информации, используемый при анализе данных, получаемых в исследованиях на экспериментальных физических установках.

Приведены некоторые методы сравнения гистограмм и результаты сравнения трех методов (статистического сравнения гистограмм (SCH), Колмогорова-Смирнова (KS) и Андерсона-Дарлинга (AD)) для определения возможности сравнения гистограмм в оценке различимости выборок, при обработке которых были получены гистограммы.

Ссылки

  1. Ioannidis Y., The history of histograms (abridged), Proceedings 2003 VLDB Conference, 2003, pp.19-30.
  2. Cha S.-H., Srihari S.N., On measuring the distance between histograms, Pattern Recognition, 2002, vol. 35, №6, pp. 1355-1370.
  3. Kolmogorov A.N., Confidence limits for an unknown distribution function, Ann.Math.Stat., 1941, vol. 12, №4, pp. 461-463.
  4. Kullback S., Information Theory and Statistics, Wiley, New York, 1959.
  5. Rosenthal J., Convergence rates for Markov chains, SIAM Rev., 1995, vol. 37, pp. 387-485.
  6. Cochran W., The chi-square test of goodness of fit, Ann.Math.Stat., 1952, vol. 23, №3, pp. 315-342.
  7. Kailath T., The divergence and Bhattacharyya distance measures in signal selection, IEEE Trans.Commun.Technol, 1967, vol.15, №1, pp. 52-60.
  8. Hellinger E., Neue Begrundung der Theorie quadratischer Formen von unendlichvielen Veranderlichhen, Journal fur die reine und angewandte Mathematik, (in German), 1909, vol. 1909, №136, p. 210.
  9. Anderson T.W., Darling D.A., Asymptotic theory of certain «goodness of fit» criteria based on stochastic processes, Ann. Math. Statist., 1952, vol. 23, №2, p. 193.
  10. Gretton A., Borgwardt K., Rasch M.J., Scholkopf B., Smola A.J., A Kernel method for two-sample problem, arXiv:0805.2368, 2008.
  11. Mann H.B., Whitney D.R., On a test of whether one of two random variables is stochastically larger than the other, Ann.Math.Stat, 1947, vol.18, №1, p.50.
  12. Bandemer H., Nather W., Fuzzy data analysis, Kluwer academic publishers, Dordrecht, 1992.
  13. Luuka P., Collan M., Modulo similarity in comparing histograms, Proc. of IFSA-EUSFLAT2015, Eds. Alonso J.M., Bustince H., M. Reformat, Atlantis Press, 2015.
  14. Bityukov S., Krasnikov N., Nikitenko A., Smirnova V., A method for statistical comparison of histograms, arXiv:1302.2651, 2013.
  15. Krupanek B., Bogacz R., Comparison algorithm of multimodal histograms from wireless transmission, Przeglad Electrotechniczny, 2014, №11, p.32.
  16. Cao Y., Petzold L., Accuracy limitations and the measurement of errors in the stochastic simulation of chemically reacting systems, J. of Computational Physics, 2006, vol. 212, №1, pp. 6-24.
  17. Xu K.-M., Using the bootstrap method for a statistical significance test of differences between summary histograms, NASA Technical Reports Server, ID: 20080015431, 2006.

гистограмма метод Монте-Карло поток событий тестовая статистика