Продолжение поста #tlmdj
Немного поменял первичное округление (не в сторону ближайшего значения, а в сторону самой частой оценки).
К моему огромному удивлению, мой график — внутри самого большого кластера (который 46,9%).
Уже примерно знаю как буду нормализировать оценки, исходя из графика конкретного пользователя.
К сожалению, кластеризация проводилась только по 3000 рандомных пользователей, на бо́льших массивах — падение HHVM по сегфолту.
Дата: 03 ноября 2014, 11:53