Форма входа

Туча тегов

Яндекс.Метрика

Обратная связь

При всех претензиях к контенту, вопросах и предложениях вы можете пользоваться адресом admin@animefag.ru
Поиск по тегу

mal


Найдено: 15 записей

Только сегодня ночью подпилил код, чтобы страницы качались на 10%-20% быстрее. А сейчас они впилили защиту от слишком частых запросов и скорость упала раза в три.

 

Один шажок вперёд, три шага назад. Охренеть

Прочитать всё (0 комментариев) Под катом есть текст Дата: 25 мая 2015, 19:02

Тайтлы не обновляются

Нужно обновить 493 записей о тайтлах в MyAnimeList

А я ещё на 100 жаловался. Но это не новые аниму, это редкие аниму и манга, которые очень редко встречаются у людей

Прочитать всё (0 комментариев) Под катом есть текст Дата: 31 марта 2015, 16:43

На MAL добавилось сразу 102 аниме и манги. Чего-то раньше такого не было

http://myanimelist.net/anime/30442

http://myanimelist.net/anime/30480

http://myanimelist.net/anime/30491

http://myanimelist.net/manga/87769

_______________________

Вот интересный вопрос: а откуда вообще берутся данные о новом аниме? Кто их постит? Компании (Staff, Shaft etc) постят на своём сайте анонсы, за которыми постоянно следят люди, которые и добавляют данные на сайты. Так что ли?

Прочитать всё (0 комментариев) Дата: 31 марта 2015, 13:28

Да, новая геноферма будет делаться дольше, чем я думал.

На написание одного только прекомпьюта уйдёт вся эта неделя. Пока увяз в Гауссовой нормализации (выставление оценок, исходя из частотности этих оценок, а не тупо от среднего арифметического).

На графике распределения полу-нормализованных оценок. Фиолетовый и зелёный — распределения здорового человека. Бордовый — распределения @linda-chan.

У каждого по 4 графика. Это средний/максимальный балл тайтлу (точнее франшизу) \* неустаревшие/все оценки. Графики у одного человека между собой похожи. У кого все оценки неустарели (не проставлял дату), у того только два графика.

Прочитать всё (0 комментариев) Под катом есть текст Дата: 02 декабря 2014, 16:52

Продолжение поста #tlmdj

Немного поменял первичное округление (не в сторону ближайшего значения, а в сторону самой частой оценки).

К моему огромному удивлению, мой график — внутри самого большого кластера (который 46,9%).

Уже примерно знаю как буду нормализировать оценки, исходя из графика конкретного пользователя.

К сожалению, кластеризация проводилась только по 3000 рандомных пользователей, на бо́льших массивах — падение HHVM по сегфолту.

Прочитать всё (0 комментариев) Дата: 03 ноября 2014, 11:53

Это разброс оценок пользователей в МАЛе. Оценки предварительно нормированы (выкинуты ненужные тайтлы типа спешалов, выкинуты старые оценки, франшизы сведены в одну оценку), взят средний балл, округлён, принят за ноль и относительно него линейно исправлены остальные баллы пользователя. Ноль по X это средний балл пользователя, листья влево и вправо это сам разброс. Название в легенде это кол-во процентов подобных этому графиков. Плюс свой график я выделил отдельно. По графику видно, что я чаще всего ставлю +1/+2 реальных (нормализованных по текущему принципу моей системы) балла, это 6 и 7 баллов на MAL'е соответственно.

Как ни странно, чувствуется нормальное распределение у большинства пользователей: 72.7% пользователей расставляют оценки так, что получается красивый график. Я хотел провести нормализацию не через линейную разницу со средним баллом (сейчас это работает именно так), а исходя из процентов на нуле и в первой сигме и, допустим, принимать N% баллов из центра за 0 баллов, L% за 1/-1, M% за 2/-2 etc... При этом считать N, L и M исходя из того как ставит их пользователь: если у пользователя очень много средних баллов, значит он вменяемый человек, и у него должны быть и очень большие и очень малые оценки, а если он @radjah, то его максимальной оценкой будет +1 и только на тайтлах, которым он поставил 10 баллов на MAL'е.

Но тут случился конфуз. Дело в том, что у меня и ещё у 8%-15% уебанов там ВОТ ЭТО ЗАГОГУЛИНА вместо нормального распределения.

В идеале верхушки графиков должны быть ровно по центру (то есть самая частая оценка максимально близка к среднему баллу), но некоторые графики таким свойством не обладают. Тот фиолетовый график с 4.1 это просто пушка, люди будто линейно распределяли оценки (то есть каждый балл ставили в равном количестве).

И вот теперь я УДРУЧЕН. Идея провалилась. Если вместо среднего арифметического брать хи-квадрат или среднее геометрическое, по идее графики ещё сильнее вправо уйдут. На ночь запущу считалку с такой логикой.

Прочитать всё (0 комментариев) Под катом есть текст Дата: 02 ноября 2014, 5:00