Actividades preparatorias para el practico de la semana 13-19 de Junio

Actividades preparatorias para el practico de la semana 13-19 de Junio

por ALVAREZ FERNANDO -
Número de respostas: 0


Evaluar predicciones
Una vez les llegue el mail de augustus con el link a sus resultados, descarguen el archivo predictions.tar.gz. Es preciso descomprimirlo para obtener un directorio llamado augustus el cual contiene los siguientes archivos:

prompt@maquina:$ tar -xzf predictions.tar.gz
augustus.aa        #Archivo multifasta con las secuencias predichas (aminoacidos)
augustus.cdsexons  #Archivo multifasta con las secuencias predichas (exones indi)
augustus.codingseq #Archivo multifasta con las secuencias codificante predichas (ADN)
augustus.gbrowse   #Archivo de anotación
augustus.gff       #Archivo de anotación en formato genérico

augustus.gtf       #Archivo de anotación en formato genérico (usar este)


ATENCIÓN: EN CASO que el servidor de augustus no haya dado señales de vida para el miércoles las predicciones y las secuencias aminoacídicas pueden ser bajadas de la maquina scoville

prompt@maquina:$  scp scoville3e6.fcien.edu.uy:/media2/YEAST/predicciones/* .


De acuerdo a lo indicado en el instructivo realice la evaluación de la calidad de las predicciones usando el programa busco. Obtenga una tabla comparativa para ensamblaje corregido y sin corregir

Recordatorio del uso de busco

prompt@maquina:$ busco -i augustus_NOcorregido.aa -o BUSCO_NOcorregido -l saccharomycetes_odb10 -m proteins -f
prompt@maquina:$ busco -i augustus_corregido.aa -o BUSCO_corregido -l saccharomycetes_odb10 -m proteins -f

Adelantar la anotación para la clase del jueves

  1. Correr blastp vs Uniprot DB
  • Copie el archivo augustus.aa (correspondiente al ensamblaje corregido) al servidor scoville3e6 usando

  • prompt@maquina:$ scp augustus.aa cursogN@scoville3e6.fcien.edu.uy:~/

  • Y corra blastp con los siguientes comandos:
prompt@maquina:$ nohup blastp -query augustus.aa -db /media2/uniprot/uniprot_db -evalue 1e-15 -max_hsps 1 -max_target_seqs 1 -outfmt "6 std qlen slen" -out augustusVsUniprot.bl -num_threads 4


  2- Correr Blast Koala para acceder a los números EC de las proteínas correspondientes a enzimas.
Deben subir el archivo multifasta clickeando donde indica la flecha. Poner el numero de taxonomia correspondiente a levadura ( 889517) y solicitar confirmacion del envio por e-mail







Atencion: Koala permite un máximo de 5000 proteínas a ser enviadas cada vez. Por tanto deberán separan su archivo que tiene cerca de 6000 proteínas en 2 partes