Это разброс оценок пользователей в МАЛе. Оценки предварительно нормированы (выкинуты ненужные тайтлы типа спешалов, выкинуты старые оценки, франшизы сведены в одну оценку), взят средний балл, округлён, принят за ноль и относительно него линейно исправлены остальные баллы пользователя. Ноль по X это средний балл пользователя, листья влево и вправо это сам разброс. Название в легенде это кол-во процентов подобных этому графиков. Плюс свой график я выделил отдельно. По графику видно, что я чаще всего ставлю +1/+2 реальных (нормализованных по текущему принципу моей системы) балла, это 6 и 7 баллов на MAL'е соответственно.
Как ни странно, чувствуется нормальное распределение у большинства пользователей: 72.7% пользователей расставляют оценки так, что получается красивый график. Я хотел провести нормализацию не через линейную разницу со средним баллом (сейчас это работает именно так), а исходя из процентов на нуле и в первой сигме и, допустим, принимать N% баллов из центра за 0 баллов, L% за 1/-1, M% за 2/-2 etc... При этом считать N, L и M исходя из того как ставит их пользователь: если у пользователя очень много средних баллов, значит он вменяемый человек, и у него должны быть и очень большие и очень малые оценки, а если он @radjah, то его максимальной оценкой будет +1 и только на тайтлах, которым он поставил 10 баллов на MAL'е.
Но тут случился конфуз. Дело в том, что у меня и ещё у 8%-15% уебанов там ВОТ ЭТО ЗАГОГУЛИНА вместо нормального распределения.
В идеале верхушки графиков должны быть ровно по центру (то есть самая частая оценка максимально близка к среднему баллу), но некоторые графики таким свойством не обладают. Тот фиолетовый график с 4.1 это просто пушка, люди будто линейно распределяли оценки (то есть каждый балл ставили в равном количестве).
И вот теперь я УДРУЧЕН. Идея провалилась. Если вместо среднего арифметического брать хи-квадрат или среднее геометрическое, по идее графики ещё сильнее вправо уйдут. На ночь запущу считалку с такой логикой.
не очень хорошего, но выстрелившего в нужного человека тайтла
Да, это называется субъективная оценка, я её и пытаюсь предугадать
Сейчас попробую ещё хитро сдвинуть графики на один балл засчёт округления среднего не в ближайшую сторону, а в сторону самого частого балла, если он в приделах единицы. Таким образом графики с центром на +1 должны выровняться на 0 и стать обычным нормальным распределением.
Правда ждать долго, текущий подсчёт займёт ещё часов 5
Дата: 02 ноября 2014, 5:00