Big Data
Може би е добре да се включи в курса и лекция за Big Data, ако не се направи отделен курс на тази тема.
Целият този бум се дължи на технологиите около Big Data.
Подкрепям идеята за курс за big data. Една лекция е недостатъчна.
Основните концепции са няколко и се въртят около 2 аспекта: 1) processing на части, паралелно; 2) ефективно съхранение.
Има различни библиотеки и технологии, но основната част от big data не е самата обработка на данните, а sysadmin, devops и подобни неща (като cloud services, deployment, availability, data storage and redundancy, security, parallel processing и т.н.). Като цяло е много по-близо до системната администрация и програмирането, отколкото до работата с данни, моделирането и търсенето на информация.
Лично на мен ми харесва повече идеята за обработка, а концепциите там са същите, като тези, които учим в този курс. Sysadmin-ските неща не са за data scientists по принцип. Затова не се интересувам да водя такъв курс.
Ако има голям интерес, ще направя допълнително видео.
P.S.: Книжката на @m_nikolova93 е добра, но big data отдавна не е само Hadoop.
Благодаря, Данчо!