SMILES (от англ. simplified molecular-input line-entry system) e опростена система за записване на редове за молекулно въвеждане – спецификация под формата на линейна нотация за описание на структурата на химически видове, използвайки къси ASCII низове. Низовете SMILES могат да бъдат импортирани от повечето редактори на молекули за обратно преобразуване в двуизмерни чертежи или триизмерни модели на молекулите.

Алгоритъм за генериране на SMILES за ципрофлоксацин: прекъсване на цикли, след това записване като разклонения от главната връзка

История редактиране

Оригиналната спецификация SMILES е инициирана от Дейвид Уайнингер в лабораторията на USEPA в Дълют през 1980 г.[1][2][3][4] Американската агенция за опазване на околната среда финансира първоначалния проект за разработване на SMILES.[5][6]

Оттогава спецификацията е модифицирана и разширена от други, най-вече от Daylight Chemical Information Systems. През 2007 г. общността на химиците за отворен код Blue Obelisk разработва отворен стандарт, наречен OpenSMILES.

Описание редактиране

Атоми редактиране

Атомите са представени със стандартното съкращение на химичните елементи в квадратни скоби, като [Au] за злато. Скобите могат да бъдат пропуснати в общия случай за атоми, за които са налице всички изброени условия:

  1. попадат в „органичната подгрупа“ на B, C, N, O, P, S, F, Cl, Br или I, и
  2. нямат официално наименование и
  3. броят свързани с тях водороди се подразбира от валентния модел на SMILES (обикновено тяхната нормална валентност, но за N и P е 3 или 5, а за S е 2, 4 или 6), и
  4. са нормалните изотопи и
  5. не са хирални центрове.

Всички други елементи трябва да бъдат оградени в скоби и да имат изрично показани заряди и водородни атоми. Например SMILES за вода могат да бъдат написани като O или [OH2]. Водородът може също да бъде написан като отделен атом; водата може също да бъде написана като [H]O[H].

Когато се използват скоби, символът H се добавя, ако атомът в скоби е свързан с един или повече водородни атоми, следван от броя на водородните атоми, ако е по-голям от 1, след това от знака + за положителен заряд или от - за отрицателен заряд. Например [NH4+] за амоний (NH+
4
). Ако има повече от един заряд, той обикновено се записва като цифра; но също така е възможно знакът да се повтори толкова пъти, колкото заряди има йонът: може да се напише [Ti+4] или [Ti++++] за титан (IV) Ti4+. Така хидроксидният анион (OH) е представен от [OH-], хидрониевият катион (H3O+) е [OH3+], а кобалтовият (III) катион (Co3+) е или [Co+3] или [Co+++].

Връзки редактиране

Връзките се представят с помощта на един от символите . - = # $ : / \.

Връзките между алифатните атоми се приемат за единични, освен ако не е посочено друго и се подразбират от съседство в низа SMILES. Въпреки че единичните връзки могат да бъдат написани като -, това обикновено се пропуска. Например, SMILES за етанол може да бъде написани като C-C-O, CC-O или C-CO, но обикновено се изписват CCO.

Двойните, тройните и четворните връзки са представени със символите =, # и $ съответно, както е илюстрирано от SMILES O=C=O (въглероден диоксид CO2), C#N (циановодород HCN) и [Ga+]$[As-] (галиев арсенид).

Допълнителен вид връзка е „не-връзка“, която се обозначава с ., за да покаже, че две части не са свързани заедно. Например, водният разтвор на натриев хлорид може да бъде изписан като [Na+].[Cl-], за да покаже дисоциацията.

Ароматна връзка „една и половина“ може да бъде обозначена с :.

Единичните връзки, съседни на двойни връзки, могат да бъдат представени с помощта на / или \ за обозначаване на стереохимична конфигурация.

Източници редактиране

  1. SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules // Journal of Chemical Information and Computer Sciences 28 (1). February 1988. DOI:10.1021/ci00057a005. с. 31–6.
  2. SMILES. 2. Algorithm for generation of unique SMILES notation // Journal of Chemical Information and Modeling 29 (2). May 1989. DOI:10.1021/ci00062a008. с. 97–101.
  3. SMILES. 3. DEPICT. Graphical depiction of chemical structures // Journal of Chemical Information and Modeling 30 (3). August 1990. DOI:10.1021/ci00067a005. с. 237–43.
  4. The Entrance of Informatics into Combinatorial Chemistry // The History and Heritage of Scientific and Technological Information Systems: Proceedings of the 2002 Conference of the American Society of Information Science and Technology and the Chemical Heritage Foundation. Medford, NJ, Information Today, 2004. ISBN 978-1-57387-229-4. с. 205.
  5. SMILES: A line notation and computerized interpreter for chemical structures. Duluth, MN, U.S. EPA, Environmental Research Laboratory-Duluth, 1987. Report No. EPA/600/M-87/021.
  6. SMILES Tutorial: What is SMILES? // U.S. EPA. Посетен на 2012-09-23.

Външни препратки редактиране

    Тази страница частично или изцяло представлява превод на страницата Simplified molecular-input line-entry system в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс – Признание – Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година – от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница, за да видите списъка на съавторите. ​

ВАЖНО: Този шаблон се отнася единствено до авторските права върху съдържанието на статията. Добавянето му не отменя изискването да се посочват конкретни източници на твърденията, които да бъдат благонадеждни.​