Установка:

Для установки python-mrjob в Ubuntu / Linux Mint / Debian, введите в Терминал:

sudo apt update
sudo apt install python-mrjob

Подробная информация о пакете:

Каркас MapReduce для написания и работы Hadoop Streaming

Mrjob — пакет Python, который помогает вам писать и запускать задания Hadoop Streaming.

Mrjob полностью поддерживает сервис Amazon Elastic MapReduce (EMR), который позволяет вам покупать время в кластере Hadoop на почасовой основе. Он также работает с вашим собственным кластером Hadoop.

Зависимости:

  • python

  • python-boto

  • python-simplejson

    простой, быстрый, расширяемый кодер / декодер JSON для Python 2.x

  • python-yaml

    Парсер YAML и эмиттер для Python

  • python2.7

    Интерактивный объектно-ориентированный язык высокого уровня (версия 2.7)