Сначала ген из 4-символьного алфавита ДНК (A,T,G,C) переписывается с помощью процесса транскрипции в 4-символьный алфавит РНК (A,U,G,C), а из РНК могут быть переведены с помощью процесса трансляции в 20-символьный алфавит аминокислот синтезируемого белка.
Поскольку существует 4 различных азотистых основания (аденин, гуанин, цитозин, тимин), а аминокислоты кодируются кодоном, состоящим из комбинаций трёх нуклеотидов, то по законам комбинаторики общее число кодонов равно числу размещений с повторениями: , комбинации, из которых 61 комбинация кодирует определённые аминокислоты, а 3 оставшихся кодона (UGA, UAG и UAA) сигнализируют об остановке трансляции полипептидной цепи и называются стоп-кодонами.
Стартовым кодоном у эукариотических организмов является триплет AUG в мРНК, кодирующий метионин, с которого начинается образование полипептидной цепи в процессе трансляции.
У некоторых прокариот стартовыми кодонами также являются GUG, AUU, CUG, UUG.
Так как в процессе биосинтеза белка в полипептидную цепь участвует всего 20 аминокислот, то различные кодоны могут кодировать одинаковые аминокислоты, такие кодоны принято называть изоакцепторными кодонами.
A Кодон AUG кодирует метионин и одновременно является сайтом инициации трансляции: первый кодон AUG в кодирующей области мРНК служит началом синтеза белка[1].
По крайней мере у 16 типов организмов генетический код отличается от канонического. Например многие виды зелёных водорослей Acetabularia транслируют стандартные стоп-кодоны UAG и UAA в аминокислоту глицин, а гриб Candida интерпретирует РНК-кодон CUG не как лейцин, а как серин. А у митохондрий пекарских дрожжей (Saccharomyces cerevisiae) четыре из шести кодонов, обычно транслирующихся в лейцин, кодируют треонин.
Существование таких вариаций свидетельствует о возможной эволюции генетического кода.
Представители всех трёх доменов живых организмов иногда прочитывают стандартный стоп-кодон UGA как 21-ю аминокислоту селеноцистеин, не относящуюся к 20 стандартным. Селеноцистеин образуется при химической модификации серина на стадии, когда последний ещё не отсоединился от тРНК в составе рибосомы.
Аналогично у представителей двух доменов (архебактерий и бактерий) стоп-кодон UAG прочитывается как 22-я аминокислота пирролизин.