As estruturas exatas, em escala atômica, da maioria das proteínas que desempenham um papel-chave no ciclo de vida do vírus Zika (ZIKV) ainda têm que ser determinadas experimentalmente (por métodos de cristalografia de raios-X ou ressonância magnética nuclear). Atualmente a estrutura da partícula viral completa foi elucidada a partir de Crio-ME (crio-microscopia eletrônica)1sendo possível obter as estruturas das glicoproteínas E e M.

Além disso, recentemente, foram determinadas as estruturas das proteínas  NS12 e E3. Para as outras proteínas, os pesquisadores irão utilizar estruturas aproximadas, derivadas de um processo conhecido como modelagem por homologia, até serem obtidos dados experimentais de todas as proteínas.

Estrutura da proteína NS1 determinada por cristalografia de raio-X

Estrutura da glicoproteína E determinada por cristalografia de raio-X

A modelagem por homologia é uma ferramenta computacional que auxilia na obtenção das coordenadas 3D de proteínas, baseada em proteínas homólogas. Vários passos compõem o processo de modelagem: (1) identificação do padrão; (2) alinhamentos únicos ou múltiplos das sequencias primárias; (3) construção de modelos para o alvo baseda na estrutura 3D do padrão; (4) refinamento dos modelos, análise dos alinhamentos, deleção e adição de gaps, e (5) validação do modelo.3

No caso das proteínas do ZIKV, o processo envolve a utilização de informação genética e busca por alvos de proteínas muito similares às do ZIKV de outros organismos, como os vírus da dengue, do Nilo Ocidental, da encefalite Murray Valley e da encefalite Japonesa, para os quais algumas proteínas são conhecidas. Essas estruturas conhecidas são usadas como base para desenvolver modelos dos alvos que possivelmente se assemelham às proteínas do ZIKV. Recentemente, nós descrevemos o desenvovimento de múltiplos modelos por homologia do ZIKV para NS5, FtsJ, HELICc, DEXDc, peptidase S7, NS1, haste E, glicoproteína M, propeptídeo, capsídeo e glicoproteína E.4

É importante destacar que os nossos modelos por homologia obtidos para as proteínas NS1 e E, (disponíveis on line em 3 de Março de 2016)mostraram  boa sobreposição sobre as estruturas NS1 e E determinadas experimentalmente por cristalografia de raio-X(publicados em 18 de April e 2 de Maio de 2016, respectivamente).

Quando alinhamos ambas estruturas da NS1 (carbonos alfa, cadeia A), o RMSD (desvio médio quadrático, root mean square deviation) médio, de uma estrutura em relação a outra, foi de 0,818 Å. O alinhamento entre ambas estruturas da glicoproteína E (carbonos alfa, cadeia A) também foi bom e o RMSD médio foi de 1,860 Å. A Figura das proteínas sobrepostas podem ser observadas abaixo.

Estrutura cristalográfica da proteína NS1 (violeta, Cadeia A) alinhada com o modelo por homologia da NS1 (laranja, Cadeia A)

Estrutura cristalográfica da glicoproteína E (azul, carbonos alfa, Cadeia A)3  alinhados com a estrutura do modelo por homologia da glicoproteína E (rosa, carbonos alfa, Cadeia A)

As imagens abaixo mostram as estruturas dos modelos por homologia do ZIKV (proteínas minimizadas) que tem boa cobertura com as proteínas template e os gráficos Ramachandran para cada proteína, mostrando os ângulos diedrais Phi e Psi para todos os aminoácidos da estrutura proteica.4 Nos gráficos Ramachandran, a região em vermelho representa as combinações mais favorecidas de Phi-Psi;  em amarelo representa as combinações adicionalmente permitidas; em bege representa as combinações “generosamente” permitidas e branco as combinações não permitidas.

Modelo por homologia da proteína NS5 (esquerda) e gráfico Ramachandran para a proteína NS5 do ZIKV (direita)

Modelo por homologia da proteína FtsJ (esquerda) e gráfico Ramachandran para a proteína FtsJ do ZIKV (direita)

Modelo por homologia da proteína HELICc (esquerda) e gráfico Ramachandran para a proteína HELICc do ZIKV (direita)

Modelo por homologia da proteína DEXDc (esquerda) e gráfico Ramachandran para a proteína DEXDc do ZIKV (direita)

Modelo por homologia da proteína S7 (esquerda) e gráfico Ramachandran para a proteína S7 do ZIKV (direita)

Modelo por homologia da proteína NS1 (esquerda) e gráfico Ramachandran para a proteína NS1 do ZIKV (direita)

Modelo por homologia da proteína E Stem (esquerda) e gráfico Ramachandran para a proteína E Stem do ZIKV (direita)

Modelo por homologia da proteína Glicoproteína M (esquerda) e gráfico Ramachandran para a proteína Glicoproteína M do ZIKV (direita)

Modelo por homologia do Propeptídeo (esquerda) e gráfico Ramachandran para o Propeptídeo do ZIKV (direita)

Modelo por homologia do Capsídeo (esquerda) e gráfico Ramachandran para o Capsídeo do ZIKV (direita)

Modelo por homologia da Glicoproteína E (esquerda) e gráfico Ramachandran para a Glicoproteína E do ZIKV (direita)

Esses modelos podem ser usados para priorizar compostos a serem testados em experimentos in vitro. Em estudos anteriores, modelos por homologia foram utilizados com sucesso para identificar novos compostos que provaram ser eficazes contra proteínas alvos patogênicas. Projetos da World Community Grid como Genome Comparison e Uncovering Genome Mysteries tem sido úteis na identificação de proteínas similares.

.

1. Sirohi, D.; Chen, Z.; Sun, L.; Klose, T.; Pierson, T. C.; Rossmann, M. G.; Kuhn, R. J. The 3.8 Å resolution cryo-EM structure of Zika virus, Science, 2016; 352(6284):467-470.10.1126/science.aaf5316

2. Song, H.; Qi, J.; Haywood, J.; Shi, Y.; Gao, G.F. Zika virus NS1 structure reveals diversity of electrostatic surfaces among flaviviruses, Nat.Struct.Mol.Biol. 2016; 23(5):456-458. 10.1038/nsmb.3213

3.Vyas,V. K.; Ukawala, R. D.; Ghate,M.; Chintha,C. Homology Modeling a Fast Tool for Drug Discovery: Current Perspectives, Indian J Pharm Sci. 2012; 74(1): 1–17. 10.4103/0250-474X.102537

4. Ekins, S.; Liebler, J.; Neves, B. J.; Lewis, W. G.; Coffee, M.; Bienstock, R.; Southan, C.; Andrade, C. H. Illustrating and Homology Modeling the Proteins of the Zika Virus. F1000Research 2016; 5 (0), 275. 10.12688/f1000research.8213.1