Skip to content

Latest commit

 

History

History
92 lines (71 loc) · 2.95 KB

README.md

File metadata and controls

92 lines (71 loc) · 2.95 KB

Programación Distribuida sobre Grandes Volúmenes de Datos

Como instalar el software necesario para la materia

En tu computadora (>4GB ram)

        conda create -n python-zeppelin python=3.6
  • Instalar los paquetes:
        conda activate python-zeppelin
        conda install matplotlib pandas plotly
        conda install openjdk=8.0.152
  • Bajar el archivo zip desde aquí y descomprimir (debe haberse creado un directorio spark).

  • Ejecutar desde el directorio spark recién creado y en el environment de anaconda:

        cd zeppelin-0.8.2-bin-all
        bin/zeppelin.sh

En nabucodonosor

  • Hacer ssh a tu cuenta en nabucodonosor

  • Instalar Anaconda.

        wget https://repo.anaconda.com/archive/Anaconda3-2020.07-Linux-x86_64.sh
        chmod 755 Anaconda3-2020.07-Linux-x86_64.sh
        ./Anaconda3-2020.07-Linux-x86_64.sh
        . .bashrc
  • Crear un environment anaconda:
        conda create -n python-zeppelin python=3.6
  • Instalar los paquetes:
        conda activate python-zeppelin
        conda install matplotlib pandas plotly
        conda install openjdk=8.0.152
  • Bajar el archivo zip desde aquí y descomprimir:
        cd
        wget http://cs.famaf.unc.edu.ar/~damian/tmp/bigdatasoft.zip
        unzip bigdatasoft.tgz

(debe haberse creado un directorio spark)

  • Ejecutar desde el directorio spark recién creado los siguientes comandos (cambiar puerto para que cada usuario use uno distinto):
        echo $[$UID+8080] # recordar <nuevo puerto> (anotarlo)
        cd spark/zeppelin-0.8.2-bin-all/conf
        sed "s/<value>8080/<value>$[$UID+8080]/" zeppelin-site.xml.template > zeppelin-site.xml
  • Ejecutar (en el environment de anaconda):
        cd ..
        bin/zeppelin.sh
En tu maquina (linux):
  • En terminal hacer port forwarding de ssh:
        ssh -vCN -L 8080:localhost:<nuevo puerto> -l <login en nabuco> nabucodonosor.ccad.unc.edu.ar
Nota:

Para hacer port forwarding de ssh en windows ver https://docs.microsoft.com/en-us/azure/hdinsight/hdinsight-linux-ambari-ssh-tunnel.