Duda tarea ensamblado

Duda tarea ensamblado

por PULIDO DAVID -
Número de respostas: 1

Buenas tardes, 

Tengo una duda sobre la tarea que nos mandasteis para hacer para el próximo viernes. Una vez que he corrido el programa canu con los comandos que pone en el documento de la práctica me aparecen 3 carpetas, una para cada uno de las secuencias. Hay archivos fasta y fastq que puedo ver con el comando fastq pero, aparte de eso no sé cómo seguir con la tarea. 

Creo que Velvet no tengo que utilizarlo porque he entendido que ese programa se utiliza para lecturas cortas. Entonces no se si tengo que continuar de la misma manera (cortando el genoma y luego usar velvet) o no he entendido como funciona canu.

Dentro de cada carpeta tengo archivos que supongo que es lo que me ha generado canu, pero ninguno me suena y no se cómo trabajar con ellos. 

Gracias

Em resposta à PULIDO DAVID

Re: Duda tarea ensamblado

por BILBAO LUCIA -
Hola David, cómo estas?
Disculpa le demorar en responder!

Creo que lo habíamos hablado personalmente en clase al final, pero lo dejo por aquí por las dudas. Esta bien haber tenido como resultado 3 carpetas, Canu corrió bien. Para los ensamblados no tenias que haber hecho nada más. Luego Assembly-scan para evaluar esos ensamblados, que fue lo que hicimos en la segunda clase. Ese archivo fasta que dices, es el resultado del ensamblado y es el que van a seguir usando en el resto de las clases. Si le haces ll -h en la terminal vas a ver que tiene le tamaño del genoma de E. coli, ~4.5 Mb.

Para Canu no tenemos que hacer un filtrado de calidad, eso lo hablamos en clase. Esto es debido a que para PacBio-Raw las lecturas son de muy mala calidad, y nos quedaríamos sin lecturas. Y por el contrario, las de PacBio HIFI son de excelente calidad, por lo que no necesitamos hacerle ningún filtrado.

Los archivos que van a necesitar para la próxima clase son los .fasta de todos los ensamblados.

Saludos!
Lucia