ITI0011RUS:упражнение 03

Allikas: Kursused
Mine navigeerimisribale Mine otsikasti

Срок сдачи упражнения 5-е занятие (18-е февраля).

Общая информация об упражнениях: ITI0011RUS_Practice.
Обратно на страницу предмета.

Описание

ДНК представляет собой последовательность аминокислот, которые обозначают символами A, C, G, T.

Например, "AACCGTAGC" в то же время строки "acgt", "AJ2IKK", "AcGTLKO" не являются ДНК, так как содержат посторонние символы.


Задание 1

Проверить, является ли строка последовательностью ДНК. Если строка содержит посторонние символы, представляет собой null-объект, либо количество символов в строке не кратно трем - функция должна вернуть False, иначе True. Имейте в виду, что если передается пустая строка, то функция должна вернуть True

<source lang="java"> public static boolean isValidDnaSequence(String sequence) </source>

Например: <source lang="java"> isValidDnaSequence(null) → false isValidDnaSequence("AAAACCGTACCC") → true isValidDnaSequence("") → true isValidDnaSequence("GKS") → false isValidDnaSequence("a") → false </source>


Задание 2

Посчитать сколько раз встречается каждый из символов и вернуть наибольшее значение. Если строка не является ДНК, то функция должна вернуть -1 (для проверки используйте уже написанную isValidDnaSequence(String sequence) )

<source lang="java">

       public static int highestOccurrence(String dnaSequence)

</source>

Например: <source lang="java"> highestOccurrence(null) → -1 highestOccurrence("ACAACCGTGCGC") → 5 </source> A: 3 раза, C: 5 раз, G: 3 раза, T: 1 раз


Задание 3

Преобразовать ДНК в РНК. Это происходит путем замены символов: A -> U, G -> C, C -> G, T -> A. Если строка не является ДНК, то функция должна вернуть null (для проверки используйте уже написанную isValidDnaSequence(String sequence) )

<source lang="java">

       public static String transcribe(String dnaSequence) 

</source>

Например: <source lang="java"> transcribe("AAGGCCTTG") → UUCCGGAAC transcribe("TATATA") → AUAUAU transcribe("klj") → null transcribe("TATA") → null </source>


Задание 4

Преобразовать ДНК в белок. Преобразование происходит в 2 этапа: 1. Преобразование ДНК в РНК (используйте transcribe(String dnaSequence) ) 2. Полученная строка разбивается на тройки символов и составляется белок в соответствии с таблицей преобразования

UUU F      CUU L      AUU I      GUU V
UUC F      CUC L      AUC I      GUC V
UUA L      CUA L      AUA I      GUA V
UUG L      CUG L      AUG M      GUG V
UCU S      CCU P      ACU T      GCU A
UCC S      CCC P      ACC T      GCC A
UCA S      CCA P      ACA T      GCA A
UCG S      CCG P      ACG T      GCG A
UAU Y      CAU H      AAU N      GAU D
UAC Y      CAC H      AAC N      GAC D
UAA Stop   CAA Q      AAA K      GAA E
UAG Stop   CAG Q      AAG K      GAG E
UGU C      CGU R      AGU S      GGU G
UGC C      CGC R      AGC S      GGC G
UGA Stop   CGA R      AGA R      GGA G
UGG W      CGG R      AGG R      GGG G

Если строка не является ДНК, то функция должна вернуть null (для проверки используйте уже написанную isValidDnaSequence(String sequence) )

<source lang="java">

       public static String translateProtein(String dnaSequence)

</source>

Например:

<source lang="java">translateProtein("TTTAAAGGGCCC") → KFPG</source>

В этом примере ДНК строка TTTAAAGGGCCC преобразуется в РНК AAAUUUCCCGGG, которая в свою очередь разбирается на тройки символов и согласно таблице преобразования преобразуется в протеин: AAA → K, UUU → F, CCC → P, GGG → G.

Если в ходе преобразования встретился стоп-кодон, обозначенный в таблице словом Stop, то преобразование следует прекратить и вернуть преобразованную строку.

Например:

<source lang="java">translateProtein("TTTAAAGGGATTCCC") → KFP</source>


В этом примере ДНК строка TTTAAAGGGATTCCC преобразуется в РНК AAAUUUCCCUAAGGG, которая в свою очередь разбирается на тройки символов и согласно таблице преобразования преобразуется в протеин: AAA → K, UUU → F, CCC → P, UAA → Stop, GGG → G.

В случае, если функции передали строку, которая не является корректной ДНК, она должна вернуть значение null. <source lang="java">translateProtein("AKLFAAAcr") → null</source>

Шаблон

<source lang="java"> /**

* Home assignment 03.
* 
*/

public class Task03 {

/** * Given a string, check whether it represents a valid * DNA sequence, e.g. it contains only A, C, G, T characters. * @param sequence Possible DNA sequence. * @return Whether the given sequence is a valid DNA sequence. */ public static boolean isValidDnaSequence(String sequence) { return true; }

/** * Given a string, find what is the highest * occurrence of one nucleotide base (A, C, G, or T). * @param dnaSequence Possible DNA sequence. * @return The number representing how many times the most * frequent nucleotide base occurs in the string. In case * the input sequence is not a valid DNA sequence, returns -1. */ public static int highestOccurrence(String dnaSequence) { return 0; }

/** * Given a possible DNA string, transcribe it to RNA. * In the transcription process, you have to do the * following substitutions: * A -> U, G -> C, C -> G, T -> A * @param dnaSequence Possible DNA sequence. * @return Transcribed RNA. In case the input sequence * is not a valid DNA sequence, returns null. */ public static String transcribe(String dnaSequence) { return ""; }

/** * Given a possible DNA string, transcribe it to RNA * and then translate RNA to protein sequence. * See http://rosalind.info/glossary/rna-codon-table/ * @param dnaSequence Possible DNA sequence. * @return Translated protein sequence. In case the input * sequence is not a valid DNA sequence, returns null. */ public static String translateProtein(String dnaSequence) { return ""; }

/** * The main method, which is the entry point of the program. * !!IMPORTANT!! You have to keep the main method in order * to get your solution tested. * @param args Arguments from the command line */ public static void main(String[] args) { System.out.println(isValidDnaSequence("AAAACCGTACCC")); // => true System.out.println(highestOccurrence("ACAACCGTGCGC")); // => 2 System.out.println(transcribe("AAGGCCTTG")); // => UUCCGGAAC System.out.println(translateProtein("ACAGCT")); // => CR

}

}

</source>