"Книга "Изучаем Spark" занимает первые позиции в моем списке рекомендаций для тех, кто желает познакомиться с этим популярным фреймворком с целью создания приложений для обработки огромных объемов данных" - Бен Лорика (Ben Lorica), ведущий специалист по работе с данными, O'Reilly Media_x000D_
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala._x000D_
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она расскажет, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных... _x000D_
"Книга "Изучаем Spark" занимает первые позиции в моем списке рекомендаций для тех, кто желает познакомиться с этим популярным фреймворком с целью создания приложений для обработки огромных объемов данных" - Бен Лорика (Ben Lorica), ведущий специалист по работе с данными, O'Reilly Media_x000D_
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala._x000D_
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она расскажет, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения._x000D_
С помощью этой книги вы:_x000D_
познакомитесь с особенностями Spark, такими как распределенные наборы данных, кэширование в памяти и интерактивные оболочки;_x000D_
изучите мощные встроенные библиотеки Spark, включая Spark SQL, Spark Streaming и MLlib;_x000D_
научитесь пользоваться единой парадигмой программирования вместо смеси инструментов, таких как Hive, Hadoop, Mahout и Storm;_x000D_
узнаете, как развертывать интерактивные, пакетные и потоковые приложения;_x000D_
исследуете возможности использования разных источников данных, включая HDFS, Hive, JSON и S3;_x000D_
овладеете продвинутыми приемами программирования на основе Spark, такими как разделение данных на разделы и применение совместно используемых переменных.
ISBN | 978-5-97060-576-9 |
Автор | Климентьев Константин Евгеньевич |
Издательство | ДМК-Пресс |
Год | 2018 |
Переплет | обл |
Формат | 60х90/16 |
Стр. | 656 |
Серия | Профессиональное программирование |
ID | 04Л1-25 |
ID2 | 647735 |
У этого товара нет ни одного отзыва. Вы можете стать первым.