Sequence Manipulation Suite:
Descripción
Sequence Manipulation Suite (Suite de Manipulación de Secuencias) esta hecha en JavaScript 1.5, un lenguaje de scripting orientado a objetos, ligero y multi-platforma. JavaScript está regulado por la ECMA (Asociación Europea de Fabricantes de Computadoras). La primera versión del estándar ECMA está documentada en la especificación ECMA-262. El estándar ECMA-262 también está aprobado por la ISO (Organización Internacional de Normalización) como ISO-16262. JavaScript 1.5 es totalmente compatible con ECMA-262, Edición 3.

Las secuencias enviadas a la Suite no salen de su PC, éstas son manipuladas por su navegador Web, el cual ejecuta el JavaScript. Sequence Manipulation Suite es obra de Paul Stothard (Universidad de Alberta, Canada). Envíe sus preguntas y comentarios a stothard@ualberta.ca.

Descripción breve de los programas que integran la Suite:

Conversión de formato:
  • Combine FASTA - convierte múltiples registros de secuencia en formato FASTA en una sola secuencia. Por ejemplo, utilice Combine FASTA, cuando desee determinar el uso del codón en una colección de secuencias a través de un programa que sólo le permita introducir una secuencia.
  • EMBL to FASTA - acepta uno o más archivos EMBL como entrada y devuelve la secuencia de ADN de cada uno en formato FASTA. Utilice este programa cuando desee eliminar rápidamente toda la información no relativa a la secuencia de ADN del archivo EMBL.
  • EMBL Feature Extractor - acepta uno o más archivos EMBL como entrada y lee la información de las características de la secuencia descrita en las tablas de características. El programa extrae o resalta los segmentos relevantes de la secuencia y devuelve las características de la secuencia en formato FASTA. El EMBL Feature Extractor es particularmente útil cuando se desea obtener la secuencia de ADNc de una secuencia genómica que contiene muchos intrones.
  • EMBL Trans Extractor - acepta uno o más archivos EMBL como entrada y devuelve en formato FASTA cada una de las traducciones de las proteínas descritas en los archivos. Utilice EMBL Trans Extractor cuando le interesen más las traducciones predichas de las proteínas de una secuencia de ADN que la secuencia misma.
  • Filter DNA - elimina del texto los caracteres ajenos al ADN. Utilice este programa cuando desee eliminar los dígitos y espacios en blanco de una secuencia para hacerla apropiada para otras aplicaciones.
  • Filter Protein - elimina del texto los caracteres ajenos a la proteína. Utilice este programa cuando desee eliminar los dígitos y espacios en blanco de una secuencia para hacerla apropiada para otras aplicaciones.
  • GenBank to FASTA - acepta uno o más archivos GenBank como entrada y devuelve la secuencia completa de ADN de cada uno en formato FASTA. Utilice este programa cuando desee eliminar rápidamente toda la información no relativa a la secuencia de ADN de un archivo GenBank.
  • GenBank Feature Extractor - acepta uno o más archivos GenBank como entrada y lee la información de las características de la secuencia descrita en las tablas de características, de acuerdo con las reglas descritas en las notas de publicación de GenBank. El programa extrae o resalta los segmentos relevantes de la secuencia y devuelve las características de la secuencia en formato FASTA. GenBank Feature Extractor es particularmente útil cuando se desea obtener la secuencia de ADNc de una secuencia genómica que contiene muchos intrones.
  • GenBank Trans Extractor - acepta uno o más archivos GenBank como entrada y devuelve en formato FASTA cada una de las traducciones de las proteínas descritas en los archivos. Utilice GenBank Trans Extractor cuando le interesen más las traducciones predichas de las proteínas de una secuencia de ADN que la secuencia misma.
  • One to Three - convierte las traducciones de una letra a traducciones de tres letras.
  • Range Extractor DNA - acepta una o más secuencias de ADN junto con un set de posiciones o rangos. Las bases que correspondan a las posiciones o los rangos serán devueltas, ya sea en una nueva secuencia, en un set de registros FASTA, texto en mayúsculas o texto en minúsculas. Utilice el Range Extractor DNA para obtener subsecuencias por medio de información posicional.
  • Range Extractor Protein - acepta una o más secuencias proteicas junto con un set de posiciones o rangos. Los residuos que correspondan a las posiciones o los rangos son devueltas, ya sea en una nueva secuencia, en un set de registros FASTA, texto en mayúsculas o texto en minúsculas. Utilice el Range Extractor Protein para obtener subsecuencias por medio de información posicional.
  • Reverse Complement - convierte una secuencia de ADN en su reversa, su complementaria o en su contraparte reversa-complementaria. La aplicación soporta el alfabeto de ADN IUPAC y mantiene la casilla de cada caracter de la secuencia de entrada. Puede que necesite trabajar con la reversa-complementaria de una secuencia si contiene un ORF (Marco abierto de lectura) en la cadena reversa.
  • Split Codons - divide una secuencia codificante en tres nuevas secuencias, cada una compuesta por las bases de una de las tres posiciones del codón.
  • Split FASTA - divide los registros de secuencia FASTA en secuencias FASTA más pequeñas según Ud. lo especifique. Se puede utilizar un valor opcional de sobreposición (overlap) para crear secuencias solapadas.
  • Three to One - convierte las traducciones de tres letras a traducciones de una letra. Los dígitos y espacios en blanco son eliminados automáticamente. Los triples no estándar son ignorados.
  • Window Extractor DNA - acepta una o más secuencias de ADN junto con una posición y tamaño de ventana. Las bases ubicadas en la ventana serán devueltas, ya sea en una nueva secuencia, texto en mayúsculas o texto en minúsculas. Utilice Window Extractor DNA para obtener subsecuencias por medio de información posicional.
  • Window Extractor Protein - acepta una o más secuencias proteicas junto con una posición y tamaño de ventana. Las bases ubicadas en la ventana serán devueltas, ya sea en una nueva secuencia, texto en mayúsculas o texto en minúsculas. Utilice Window Extractor Protein para obtener subsecuencias por medio de información posicional.
Análisis de secuencias:
  • Codon Plot - acepta una secuencia de ADN como entrada y genera un diagrama conformado por una barra horizontal para cada codón. El largo de la barra es proporcional a la frecuencia del codón en la tabla de frecuencia de codones que Ud. indique. Utilice Codon Plot para encontrar porciones de la secuencia de ADN que puedan haber sido expresadas deficientemente o para ver una representación gráfica de una tabla de uso de codones (por medio de una secuencia de ADN conformada por un codón de cada tipo).
  • Codon Usage - acepta una o más secuencias de ADN y devuelve el número y la frecuencia de cada tipo de codón. Dado que el programa también compara las frecuencias de los codones que codifican para el mismo aminoácido (codones sinónimos), también puede utilizarlo para evaluar si una secuencia muestra preferencias por ciertos codones sinónimos.
  • CpG Islands - informa de posibles regiones de islas CpG por medio del método descrito por Gardiner-Garden y Frommer (1987). El cálculo se realiza con una ventana de 200 pb que se mueve a lo largo de la secuencia en intervalos de 1 pb. Las islas CpG se definen como rangos de secuencia donde el valor Obs/Exp es mayor que 0.6 y el contenido de GC es mayor que el 50%. El número esperado de dímeros CpG en una ventana se calcula como el número de 'C' multiplicado por el número de 'G' que haya en la ventana, dividido entre el largo de la ventana. Las islas CpG a menudo se encuentran en las regiones 5' de los genes de los vertebrados, así pues, este programa puede utilizarse para resaltar los posibles genes en secuencias genómicas.
  • DNA Molecular Weight - acepta una o más secuencias de ADN y calcula el peso molecular. Las secuencias se pueden tratar como moléculas lineares o circulares de cadena doble o simple. Utilice DNA Molecular Weight cuando calcule el número de copias de las moléculas.
  • DNA Pattern Find - acepta una o más secuencias junto con un patrón de búsqueda y devuelve el número y las posiciones de los sitios que concuerdan con el patrón. El patrón de búsqueda está escrito como una expresión regular en JavaScript, la cual se parece a expresiones regulares escritas en otros lenguajes de programación como, por ejemplo, Perl.
  • DNA Stats - devuelve el número de apariciones de cada residuo en la secuencia que Ud. introduzca. También se proveen los totales porcentuales para cada residuo y para ciertos grupos de residuos, lo que le permite comparar rápidamente los resultados obtenidos con diferentes secuencias.
  • Fuzzy Search DNA - acepta una secuencia de ADN junto con una secuencia de consulta y devuelve los sitios que son idénticos o similares entre ellas. Puede utilizar este programa, por ejemplo, para encontrar secuencias que pueden mutar y convertirse en un sitio de restricción útil.
  • Fuzzy Search Protein - acepta una secuencia proteica junto con una secuencia de consulta y devuelve los sitios que son idénticos o similares entre ellas.
  • Ident and Sim - acepta un grupo de secuencias alineadas (en formato FASTA o GDE) y calcula la identidad y similaridad de cada par de secuencias. Los valores de identidad y similaridad a menudo son utilizados para evaluar si dos secuencias comparten un ancestro o una función común.
  • Mutate for Digest - acepta una secuencia de ADN como entrada y busca las regiones que puedan mutar fácilmente para crear un sitio de restricción de interés. El programa además reporta las traducciones de las proteínas para que Ud. pueda ver cuáles marcos de lectura se alteran con las mutaciones propuestas. Utilice Mutate for Digest para encontrar las secuencias que puedan ser convertidas en sitios de restricción útiles a través de PCR o mutagénesis sitio-dirigida.
  • Multi Rev Trans - acepta un alineamiento de proteínas y se sirve de una tabla de uso de codones para generar una secuencia codificante degenerada de ADN. El programa también produce un gráfico que puede servir para encontrar las regiones de degeneración mínima a nivel del nucleótido. Utilice Multi Rev Trans cuando diseñe cebadores (primers) para PCR para la hibridación (Annealing) de una secuencia codificante sin secuenciar de una especie relacionada.
  • ORF Finder - Busca marcos abiertos de lectura (ORF) en la secuencia de ADN que Ud. introduzca. El programa devuelve el rango de cada ORF, junto con la traducción de la proteína correspondiente. ORF Finder soporta el alfabeto IUPAC y varios códigos genéticos. Utilice ORF Finder para buscar posibles segmentos de codificación de proteínas en nuevas secuencias de ADN.
  • Pairwise Align Codons - acepta dos secuencias codificantes y determina su alineamiento global óptimo. Utilice Pairwise Align Codons para buscar las regiones que se conserven de secuencias codificantes.
  • Pairwise Align DNA - acepta dos secuencias de ADN y determina su alineamiento global óptimo. Utilice Pairwise Align DNA para buscar las regiones que se conserven de las secuencias.
  • Pairwise Align Protein - acepta dos secuencias proteicas y determina su alineamiento global óptimo. Utilice Pairwise Align Protein para buscar las regiones que se conserven de las secuencias.
  • PCR Primer Stats - acepta una lista de secuencias cebadoras para PCR y devuelve un informe que describe las propiedades de cada cebador, incluidas entre ellas la temperatura de fusión, el porcentaje de contenido GC y sustentabilidad de PCR. Utilice PCR Primer Stats para evaluar posibles cebadores para PCR.
  • PCR Products - acepta uno o más moldes (templates) de secuencias de ADN y dos secuencias cebadoras. El programa busca coincidencias perfectas de sitios de hibridación de cebadores que puedan generar un producto de PCR. Los productos que resulten se organizan por tamaño y se les da un título que especifique su longitud, su posición en la secuencia original y los cebadores que los produjeron. Puede utilizar moléculas lineares o circulares como molde. Utilice PCR Products para determinar los tamaños de los productos que puede esperarse ver cuando realice PCR en el laboratorio.
  • Protein GRAVY - devuelve el valor GRAVY (grand average of hydropathy, promedio de hidrofobicidad) para las secuencias que Ud. introduzca. El valor GRAVY se calcula mediante la suma del valor de hidrofobicidad de cada residuo dividida entre la longitud de la secuencia (Kyte y Doolittle; 1982).
  • Protein Isoelectric Point - calcula el pI (punto isoeléctrico) teórico de la secuencia proteica que Ud. introduzca. Utilice Protein Isoelectric Point cuando quiera saber aproximadamente en qué parte de un gel 2-D se podrá encontrar una proteína en particular.
  • Protein Molecular Weight - acepta una o más secuencias proteicas y calcula su peso molecular. Puede anexar copias de epítopos de uso común y fusionar proteínas con ayuda de la lista provista. Utilice Protein Molecular Weight cuando desee predecir la ubicación de una proteína en un gel con relación a un set de estándares de proteínas.
  • Protein Pattern Find - acepta una o más secuencias junto con un patrón de búsqueda y devuelve el número y las posiciones de los sitios que concuerdan con el patrón. El patrón de búsqueda está escrito como una expresión regular en JavaScript, la cual se parece a expresiones regulares escritas en otros lenguajes de programación como, por ejemplo, Perl.
  • Protein Stats - devuelve el número de apariciones de cada residuo en la secuencia que Ud. introduzca. También se proveen los totales porcentuales para cada residuo y para ciertos grupos de residuos, lo que le permite comparar rápidamente los resultados obtenidos con diferentes secuencias.
  • Restriction Digest - corta una secuencia de ADN por medio de una digestión virtual con enzimas de restricción, con una, dos o tres enzimas de restricción. Los fragmentos que resulten son organizados por tamaño y se les da un título que especifique su longitud, su posición en la secuencia original y los sitios de enzimas que los produjeron. Puede digerir moléculas lineares o circulares, inclusive mezclas de moléculas (con introducir más de una secuencia en formato FASTA). Utilice Restriction Digest para determinar los tamaños de fragmento que verá cuando realice una digestión en el laboratorio.
  • Restriction Summary - acepta una secuencia de ADN y devuelve el número y ubicación de los sitios de corte por endonucleasas de restricción. Utilice este programa cuando desee saber si una enzima corta un segmento del ADN en particular.
  • Reverse Translate - acepta una secuencia proteica como entrada y utiliza una tabla de uso de codones para generar una secuencia de ADN que represente la secuencia codificante no degenerada más probable. Además devuelve una secuencia consenso que se deriva de todos los posibles codones que podría tener cada aminoácido. Utilice Reverse Translate cuando diseñe cebadores para PCR para la hibridación de una secuencia codificante sin secuenciar de una especie relacionada.
  • Translate - acepta una secuencia de ADN y la convierte en una proteína en el marco de lectura que Ud. especifique. Translate soporta el alfabeto IUPAC y varios códigos genéticos.
Gráficos de secuencias:
  • Color Align Conservation - acepta un grupo de secuencias alineadas (en formato FASTA o GDE) y colorea el alineamiento. El programa examina cada residuo y lo compara con los otros de la misma columna. Los que son idénticos en las distintas secuencias se les coloca un fondo negro y los que son similares se les coloca un fondo gris. Los residuos restantes son puestos en un fondo blanco. Puede especificar el porcentaje de residuos que deben ser idénticos y similares para aplicar el color. Utilice Color Align Conservation para mejorar los resultados de programas de alineamiento de secuencias.
  • Color Align Properties - acepta un grupo de secuencias alineadas (en formato FASTA o GDE) y colorea el alineamiento. El programa examina cada residuo y lo compara con los otros de la misma columna. Los que son idénticos o similares en las distintas secuencias se les coloca un fondo de color. El color se elige según las propiedades bioquímicas del residuo. Puede especificar el porcentaje de residuos que deben ser idénticos y similares para aplicar el color. Utilice Color Align Properties para resaltar las regiones de las proteínas que conserven propiedades bioquímicas.
  • Group DNA - ajusta el espaciado de las secuencias de ADN y añade una numeración. Puede especificar tanto el tamaño del grupo (el número de bases por grupo) como el número de bases por línea. La salida de este programa puede ser conveniente como referencia dado que la numeración y el espaciado permiten localizar bases específicas rápidamente.
  • Group Protein - ajusta el espaciado de las secuencias proteicas y añade una numeración. Puede especificar tanto el tamaño del grupo (el número de residuos por grupo) como el número de residuos por línea. La salida de este programa puede ser conveniente como referencia dado que la numeración y el espaciado permiten localizar residuos específicos rápidamente.
  • Primer Map - acepta una secuencia de ADN y devuelve un mapa textual que muestra las posiciones de hibridación de los cebadores para PCR. También se pueden mostrar los sitios de corte por endonucleasas de restricción y las traducciones de proteínas de la secuencia de ADN. Utilice este programa para producir un gráfico de referencia que será particularmente útil cuando diseñe grandes cantidades de cebadores para un molde en particular. Primer Map soporta el alfabeto IUPAC y varios códigos genéticos.
  • Restriction Map - acepta una secuencia de ADN y devuelve un mapa textual que muestra las posiciones de los sitios de restricción. También se provee la traducción de la secuencia de ADN en el marco de lectura que Ud. especifique. Utilice la información de salida de este programa cuando planifique estrategias de clonación. Restriction Map soporta el alfabeto IUPAC y varios códigos genéticos.
  • Translation Map - acepta una secuencia de ADN y devuelve un mapa textual que muestra las traducciones de las proteínas. Se puede especificar el marco de lectura de la traducción (1, 2, 3, o los tres) o puede elegir tratar el texto en mayúsculas como marco de lectura. Translation Map soporta el alfabeto IUPAC y varios códigos genéticos.
Secuencias aleatorias:
  • Mutate DNA - introduce cambios en las bases de una secuencia de ADN. Puede elegir el número de mutaciones que se introducirán y decidir si preservar o no las primeras y últimas tres bases en la secuencia para reflejar la selección que actúa para mantener los codones de inicio y parada. La posición de cada mutación se elige aleatoriamente y pueden ocurrir mutaciones múltiples en un solo sitio. Las secuencias mutadas pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia.
  • Mutate Protein - introduce cambios en los residuos de una secuencia proteica. Puede elegir el número de mutaciones que se introducirán y decidir si preservar o no el primer residuo de la secuencia para reflejar la selección que actúa para mantener un codón de inicio. La posición de cada mutación se elige aleatoriamente y pueden ocurrir mutaciones múltiples en un solo sitio. Las secuencias mutadas pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia.
  • Random Coding DNA - genera un marco de lectura abierto (ORF) aleatorio con un codón de inicio al principio y un codón de parada al final. Puede elegir el código genético que se va a utilizar y la longitud de la secuencia que se generará. Las secuencias aleatorias pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia.
  • Random DNA Sequence - genera secuencias aleatorias de la longitud que Ud. especifique. Las secuencias aleatorias pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia.
  • Random DNA Regions - reemplaza regiones de secuencias de ADN con bases aleatorias. Las secuencias aleatorias pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia.
  • Random Protein Sequence - genera secuencias aleatorias del largo que Ud. especifique. Las secuencias aleatorias pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia.
  • Random Protein Regions - reemplaza regiones de secuencias proteicas con residuos aleatorios. Las secuencias aleatorias pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia.
  • Sample DNA - elige bases de la secuencia guía aleatoriamente hasta construir una secuencia del la longitud que Ud. especifique. Cada base que se selecciona es reemplazada para que se pueda seleccionar nuevamente.
  • Sample Protein - elige residuos de la secuencia guía aleatoriamente hasta construir una secuencia del la longitud que Ud. especifique. Cada residuo que se selecciona es reemplazado para que se pueda seleccionar nuevamente.
  • Shuffle DNA - revuelve aleatoriamente una secuencia de ADN. Las secuencias revueltas (shuffled sequences) pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia, especialmente cuando la composición de la secuencia es un factor importante.
  • Shuffle Protein - revuelve aleatoriamente una secuencia proteica. Las secuencias revueltas (shuffled sequences) pueden utilizarse para evaluar la relevancia de los resultados del análisis de una secuencia, especialmente cuando la composición de la secuencia es un factor importante.

Nueva ventana | Inicio | Referencia
Tue Jun 15 14:20:11 2010
Valid XHTML 1.0! Valid CSS!