Это разброс оценок пользователей в МАЛе. Оценки предварительно нормированы (выкинуты ненужные тайтлы типа спешалов, выкинуты старые оценки, франшизы сведены в одну оценку), взят средний балл, округлён, принят за ноль и относительно него линейно исправлены остальные баллы пользователя. Ноль по X это средний балл пользователя, листья влево и вправо это сам разброс. Название в легенде это кол-во процентов подобных этому графиков. Плюс свой график я выделил отдельно. По графику видно, что я чаще всего ставлю +1/+2 реальных (нормализованных по текущему принципу моей системы) балла, это 6 и 7 баллов на MAL'е соответственно.
Как ни странно, чувствуется нормальное распределение у большинства пользователей: 72.7% пользователей расставляют оценки так, что получается красивый график. Я хотел провести нормализацию не через линейную разницу со средним баллом (сейчас это работает именно так), а исходя из процентов на нуле и в первой сигме и, допустим, принимать N% баллов из центра за 0 баллов, L% за 1/-1, M% за 2/-2 etc... При этом считать N, L и M исходя из того как ставит их пользователь: если у пользователя очень много средних баллов, значит он вменяемый человек, и у него должны быть и очень большие и очень малые оценки, а если он @radjah, то его максимальной оценкой будет +1 и только на тайтлах, которым он поставил 10 баллов на MAL'е.
Но тут случился конфуз. Дело в том, что у меня и ещё у 8%-15% уебанов там ВОТ ЭТО ЗАГОГУЛИНА вместо нормального распределения.
В идеале верхушки графиков должны быть ровно по центру (то есть самая частая оценка максимально близка к среднему баллу), но некоторые графики таким свойством не обладают. Тот фиолетовый график с 4.1 это просто пушка, люди будто линейно распределяли оценки (то есть каждый балл ставили в равном количестве).
И вот теперь я УДРУЧЕН. Идея провалилась. Если вместо среднего арифметического брать хи-квадрат или среднее геометрическое, по идее графики ещё сильнее вправо уйдут. На ночь запущу считалку с такой логикой.