Поучаствовал в паре конкурсов kaggle

17-11-2014 23:38

Недавно участвовал в Learning Social Circles in Networks и Tradeshift Text Classification.

Не вошел ни в какой топ, сделал для себя некоторые выводы:

  • нельзя верить public leaderboard, надо сосредоточиться на объяснимости модели, а не одержости метрикой.
  • нужно активнее общаться с участниками, копировать и модифицировать их модели, это быстрый способ освоить что-то нужное.
  • похоже, что нужен либо мощный комп, либо арендовать сервер для вычислений, на форуме деляться решениями, которые работают на 32Гб оперативки. Во втором конкурсе я пользовался vowpal wabbit, который хотя бы дорабатывает до конца и не грузит все в память. нужно поискать еще подобных библиотек, еще лучше составить гайд "анализ данных для нищебродов на ретро-компьютерах"
tags: data-mining kaggle
comments powered by Disqus