Снова Саша Васильев

Саша Васильев про коллаборативную фильтрацию

"Ставится математическая задача – заполнить эти пробелы, т.е. сформировать прогноз по недостающим ячейкам, предположить, какова может быть его оценка. И математик, если смотрит на эту таблицу, говорит – слушайте, это же разреженная матрица. Есть теорема сингулярного векторного разложения, которая говорит, что любую разреженную таблицу можно представить в приближении, как произведение двух матриц или двух таблиц меньшей размерности.

Одна матрица будет иметь столько столбцов, сколько в нашей оригинальной таблице, но строк там будет несколько, и вторая матрица наоборот – несколько столбцов и все исходные строки. И когда мы эти две матрицы перемножаем, получится новая матрица, которая будет очень похожа, погрешность будет очень небольшая. И чем больше столбцов мы добавляем, тем больше точность".