Я хочу писать свой диплом на тему машинного обучения или анализа данных. Что-нибудь посоветуете?

Я хочу писать свой диплом на тему машинного обучения или анализа данных. Что-нибудь посоветуете?

Я для своего диплома анализирую математические формулы в википедии и на основе этого пытаюсь найти похожие документы. За основу я взял статью "Mathematical Language Processing Project" (http://arxiv.org/abs/1407.0167)

Вы можете точно так же сделать. Взять какую-нибудь интересную свежую статью, в них всегда в конце описывается, что можно сделать дальше на основе этой статьи. И делаете. Главное научника найти, который захочет с вами этим заниматься.

Так же сейчас достаточно популярно направление Scalable Data Analysis и системы типа Apache Flink, Apacke Spark, Apache Mahout. Все эти проекты опен-сорс, и все нуждаются в желающих писать код.

Например, можете посмотреть на Apache Flink. Для этой системы сейчас активно пишется библиотека для машинного обучения и библиотека для анализа графов, а так же много другого, все на джава и скала. Вот список тем, предлагаемых для Flink в моем универе https://www.dima.tu-berlin.de/menue/theses/open_theses/. Я точно знаю, что список не полный. Например, еще есть темы, связанные с анализом графов. Так что при желании вы можете связаться с людьми по ссылке, они будут рады помочь с выбором темы.

Я для своего диплома анализирую математические формулы в википедии и на основе этого пытаюсь найти похожие документы. За основу я взял статью "Mathematical Language Processing Project" (http://arxiv.org/abs/1407.0167) Вы можете точно так же сделать. Взять какую-нибудь интересную свежую статью, в них всегда в конце описывается, что можно сделать дальше на основе этой статьи. И делаете. Главное научника найти, который захочет с вами этим заниматься. Так же сейчас достаточно популярно направление Scalable Data Analysis и системы типа Apache Flink, Apacke Spark, Apache Mahout. Все эти проекты опен-сорс, и все нуждаются в желающих писать код. Например, можете посмотреть на Apache Flink. Для этой системы сейчас активно пишется библиотека для машинного обучения и библиотека для анализа графов, а так же много другого, все на джава и скала. Вот список тем, предлагаемых для Flink в моем универе https://www.dima.tu-berlin.de/menue/theses/open_theses/. Я точно знаю, что список не полный. Например, еще есть темы, связанные с анализом графов. Так что при желании вы можете связаться с людьми по ссылке, они будут рады помочь с выбором темы.

Кстати, вот список тем дипломов, которые сейчас пишут мои одногруппники (и мой там тоже есть в списке)

https://www.dima.tu-berlin.de/menue/theses/theses_currently_underway/

  • Graph Analysis of Tracking Services in the Web with Business Perspectives
  • Visualization of Data Flow Graphs for In Situ Data Analysis
  • Ranking based on Diversity and Serendipity fot a Recipe Recommender System
  • Maintaining derived views on classes with dynamic data efficiently
  • Identifier namespaces in mathematical notation
  • Design and Implementation the Flink-Based News Recommendation on Tweeter Information
  • Online Machine Learning Techniques for Predicting Operator Performance
  • Generating example tuples for Data-Flow programs in Apache Flink
  • Linking Event References in Online News Streams to a Global Repository
  • Exploratory Analysis of the Tracked Web
  • Cardinality estimation in Shared-Nothing Parallel Dataflow Engines
Кстати, вот список тем дипломов, которые сейчас пишут мои одногруппники (и мой там тоже есть в списке) https://www.dima.tu-berlin.de/menue/theses/theses_currently_underway/ - Graph Analysis of Tracking Services in the Web with Business Perspectives - Visualization of Data Flow Graphs for In Situ Data Analysis - Ranking based on Diversity and Serendipity fot a Recipe Recommender System - Maintaining derived views on classes with dynamic data efficiently - Identifier namespaces in mathematical notation - Design and Implementation the Flink-Based News Recommendation on Tweeter Information - Online Machine Learning Techniques for Predicting Operator Performance - Generating example tuples for Data-Flow programs in Apache Flink - Linking Event References in Online News Streams to a Global Repository - Exploratory Analysis of the Tracked Web - Cardinality estimation in Shared-Nothing Parallel Dataflow Engines
878
просмотров
3
ответов
2
подписчики
Предпросмотр
введите как минимим 10 characters
WARNING: You mentioned %MENTIONS%, but they cannot see this message and will not be notified
Сохраняю...
Сохранено
Все темы будут удалено ?
Сохранены неопубликованные черновики. Нажмите для продолжения редактирования
Discard draft