Evaluar predicciones
Una vez les llegue el mail
de augustus con el link a sus resultados, descarguen el archivo
predictions.tar.gz. Es preciso descomprimirlo para obtener un directorio
llamado augustus el cual contiene los siguientes archivos:
prompt@maquina:$ tar -xzf predictions.tar.gz
augustus.aa #Archivo multifasta con las secuencias predichas (aminoacidos)
augustus.cdsexons #Archivo multifasta con las secuencias predichas (exones indi)
augustus.codingseq #Archivo multifasta con las secuencias codificante predichas (ADN)
augustus.gbrowse #Archivo de anotación
augustus.gff #Archivo de anotación en formato genérico
augustus.gtf #Archivo de anotación en formato genérico (usar este)
ATENCIÓN: EN CASO que el servidor de augustus no haya dado señales de vida para el miércoles las predicciones y las secuencias aminoacídicas pueden ser bajadas de la maquina scoville
prompt@maquina:$ scp scoville3e6.fcien.edu.uy:/media2/YEAST/predicciones/* .
De acuerdo a lo indicado en el instructivo realice la evaluación de la calidad de las predicciones usando el programa busco. Obtenga una tabla comparativa para ensamblaje corregido y sin corregir
Recordatorio del uso de busco
prompt@maquina:$ busco -i augustus_NOcorregido.aa -o BUSCO_NOcorregido -l saccharomycetes_odb10 -m proteins -f
prompt@maquina:$ busco -i augustus_corregido.aa -o BUSCO_corregido -l saccharomycetes_odb10 -m proteins -f
Adelantar la anotación para la clase del jueves
- Correr blastp vs Uniprot DB
- Copie el archivo augustus.aa (correspondiente al ensamblaje corregido) al servidor scoville3e6 usando
- prompt@maquina:$ scp augustus.aa cursogN@scoville3e6.fcien.edu.uy:~/
- Y corra blastp con los siguientes comandos:
prompt@maquina:$
nohup blastp -query augustus.aa -db /media2/uniprot/uniprot_db -evalue
1e-15 -max_hsps 1 -max_target_seqs 1 -outfmt "6 std qlen slen" -out
augustusVsUniprot.bl -num_threads 4
2- Correr Blast Koala para acceder a los números EC de las proteínas correspondientes a enzimas.
Deben subir el archivo multifasta clickeando donde indica la flecha. Poner el numero de taxonomia correspondiente a levadura (
889517) y solicitar confirmacion del envio por e-mail
Atencion: Koala
permite un máximo de 5000 proteínas a ser enviadas cada vez. Por tanto
deberán separan su archivo que tiene cerca de 6000 proteínas en 2 partes
(Editado por BERNA LUISA - envío original domingo, 13 de junio de 2021, 19:55)