SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_012467016.1 NCBI__GCF_000020465.1:WP_012467016.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

Q83E11 3-phosphoshikimate 1-carboxyvinyltransferase; 5-enolpyruvylshikimate-3-phosphate synthase; EPSP synthase; EPSPS; EC 2.5.1.19 from Coxiella burnetii (strain RSA 493 / Nine Mile phase I)
39% identity, 98% coverage: 4:428/434 of query aligns to 11:421/438 of Q83E11

query
sites
Q83E11
F
 
L
K
 
S
G
 
G
E
 
E
V
 
I
T
 
-
A
 
C
L
 
V
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
A
A
 
V
L
 
L
I
 
L
G
 
A
S
 
A
L
 
I
S
 
A
E
 
E
G
 
G
V
 
Q
T
 
T
E
 
Q
I
 
V
T
 
D
N
 
G
F
 
F
S
 
L
A
 
M
G
 
G
F
 
A
D
 
D
N
 
N
Q
 
L
S
 
A
T
 
M
L
 
V
G
 
S
V
 
A
L
 
L
H
 
Q
D
 
Q
A
 
M
G
 
G
-
 
A
-
 
S
I
 
I
E
 
Q
V
 
V
S
 
I
Q
 
E
H
 
D
E
 
E
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
-
G
 
-
R
 
-
R
 
-
I
 
-
R
 
N
K
 
I
V
 
L
I
 
V
I
 
V
S
 
E
S
 
G
R
 
V
G
 
G
L
 
M
W
 
T
S
 
G
F
 
L
T
 
Q
A
 
A
P
 
P
E
 
P
K
 
E
P
 
A
L
 
L
M
 
D
C
 
C
N
 
G
N
|
N
S
|
S
G
|
G
S
x
T
T
 
A
M
 
I
R
 
R
M
 
L
F
 
L
A
 
S
G
 
G
I
 
L
L
 
L
A
 
A
A
 
G
Q
 
Q
P
 
P
F
 
F
E
 
N
S
 
T
E
 
V
L
 
L
V
 
T
G
 
G
D
 
D
S
 
S
S
 
S
L
 
L
M
 
Q
K
 
R
R
|
R
P
 
P
M
 
M
K
 
K
R
 
R
V
 
I
A
 
I
D
 
D
P
 
P
L
 
L
R
 
T
Q
 
L
M
 
M
G
 
G
A
 
A
G
 
K
V
 
I
D
 
D
L
 
-
S
 
S
P
 
T
A
 
G
G
 
N
T
 
V
A
 
P
P
 
P
V
 
L
R
 
K
I
 
I
R
 
Y
G
 
G
T
 
N
R
 
P
D
 
R
L
 
L
T
 
T
P
 
G
L
 
I
E
 
H
Y
 
Y
R
 
Q
L
 
L
P
 
P
V
 
M
P
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
C
V
 
L
T
 
L
F
 
L
A
 
A
A
 
G
L
 
L
H
 
Y
A
 
A
D
 
R
G
 
G
E
 
K
T
 
T
R
 
C
I
 
I
I
 
T
E
 
E
S
 
P
I
 
A
R
 
P
S
 
S
R
 
R
N
 
D
H
 
H
T
 
T
E
 
E
L
 
R
M
 
L
L
 
L
G
 
K
L
 
H
E
 
F
T
 
H
I
 
Y
D
 
T
R
 
L
P
 
Q
D
 
K
G
 
D
E
 
K
R
 
Q
V
 
S
I
 
I
V
 
C
I
 
V
P
 
S
G
 
G
R
 
G
K
 
G
T
 
K
I
 
L
V
 
K
A
 
A
R
 
N
S
 
D
F
 
I
Y
 
S
I
 
I
P
 
P
A
 
G
D
 
D
P
 
I
S
 
S
A
 
S
A
 
A
C
 
A
F
 
F
I
 
F
V
 
I
A
 
V
L
 
A
G
 
A
L
 
T
L
 
I
G
 
T
S
 
P
N
 
G
S
 
S
E
 
A
I
 
I
I
 
R
I
 
L
R
 
C
D
 
R
V
 
V
C
 
G
L
 
V
N
 
N
P
 
P
T
 
T
R
 
R
V
 
L
E
 
G
F
 
V
I
 
I
P
 
N
L
 
L
L
 
L
T
 
K
G
 
M
A
 
M
G
 
G
A
 
A
D
 
D
I
 
I
T
 
E
I
 
V
E
 
T
N
 
H
S
 
Y
R
 
T
I
 
E
I
 
K
G
 
N
G
 
E
E
 
E
T
 
P
I
 
T
G
 
A
D
 
D
I
 
I
L
 
T
V
 
V
R
 
R
S
 
H
T
 
A
R
 
R
T
 
-
L
 
L
K
 
K
P
 
G
L
 
I
V
 
D
I
 
I
S
 
P
N
 
-
P
 
P
T
 
D
V
 
Q
V
 
V
A
 
P
G
 
L
V
 
T
I
 
I
D
|
D
E
 
E
L
 
F
P
 
P
M
 
V
L
 
L
S
 
L
V
 
I
L
 
A
S
 
A
A
 
A
F
 
V
S
 
A
S
 
Q
G
 
G
E
 
K
F
 
T
E
 
V
L
 
L
H
 
R
N
 
D
A
 
A
E
 
A
E
 
E
L
 
L
R
 
R
T
 
V
K
|
K
E
 
E
S
 
T
D
 
D
R
|
R
I
 
I
N
 
A
A
 
A
I
 
M
V
 
V
V
 
D
N
 
G
L
 
L
E
 
Q
R
 
K
L
 
L
G
 
G
F
 
I
D
 
A
C
 
A
E
 
E
Q
 
S
Y
 
L
P
 
P
D
 
D
G
 
G
F
 
V
R
 
I
V
 
I
I
 
Q
G
 
G
R
 
G
R
 
T
C
 
L
R
 
E
P
 
G
V
 
-
G
 
G
Q
 
E
V
 
V
T
 
N
V
 
-
A
 
-
C
 
S
F
 
Y
D
 
D
D
 
D
H
 
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
A
F
 
F
A
 
A
V
 
V
A
 
A
A
 
G
R
 
T
A
 
L
T
 
A
G
 
K
E
 
G
G
 
P
I
 
V
A
 
R
L
 
I
S
 
R
D
 
N
S
 
C
D
 
D
V
 
N
V
 
V
G
 
K
V
 
T
S
 
S
F
 
F
P
 
P
N
 
N
F
 
F
F
 
V
E
 
E
I
 
L

3slhD 1.70 angstrom resolution structure of 3-phosphoshikimate 1- carboxyvinyltransferase (aroa) from coxiella burnetii in complex with shikimate-3-phosphate and glyphosate
39% identity, 98% coverage: 4:428/434 of query aligns to 13:423/440 of 3slhD

query
sites
3slhD
F
 
L
K
 
S
G
 
G
E
 
E
V
 
I
T
 
-
A
 
C
L
 
V
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
A
A
 
V
L
 
L
I
 
L
G
 
A
S
 
A
L
 
I
S
 
A
E
 
E
G
 
G
V
 
Q
T
 
T
E
 
Q
I
 
V
T
 
D
N
 
G
F
 
F
S
 
L
A
 
M
G
 
G
F
 
A
D
|
D
N
 
N
Q
 
L
S
 
A
T
 
M
L
 
V
G
 
S
V
 
A
L
 
L
H
 
Q
D
 
Q
A
 
M
G
 
G
-
 
A
-
 
S
I
 
I
E
 
Q
V
 
V
S
 
I
Q
 
E
H
 
D
E
 
E
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
-
G
 
-
R
 
-
R
 
-
I
 
-
R
 
N
K
 
I
V
 
L
I
 
V
I
 
V
S
 
E
S
 
G
R
 
V
G
 
G
L
 
M
W
 
T
S
 
G
F
 
L
T
 
Q
A
 
A
P
 
P
E
 
P
K
 
E
P
 
A
L
 
L
M
 
D
C
 
C
N
 
G
N
|
N
S
 
S
G
|
G
S
x
T
T
 
A
M
 
I
R
 
R
M
 
L
F
 
L
A
 
S
G
 
G
I
 
L
L
 
L
A
 
A
A
 
G
Q
 
Q
P
 
P
F
 
F
E
 
N
S
 
T
E
 
V
L
 
L
V
 
T
G
 
G
D
 
D
S
 
S
S
 
S
L
 
L
M
 
Q
K
 
R
R
|
R
P
 
P
M
 
M
K
 
K
R
 
R
V
 
I
A
 
I
D
 
D
P
 
P
L
 
L
R
 
T
Q
 
L
M
 
M
G
 
G
A
 
A
G
 
K
V
 
I
D
 
D
L
 
-
S
 
S
P
 
T
A
 
G
G
 
N
T
 
V
A
 
P
P
 
P
V
 
L
R
 
K
I
 
I
R
 
Y
G
 
G
T
 
N
R
 
P
D
 
R
L
 
L
T
 
T
P
 
G
L
 
I
E
 
H
Y
 
Y
R
 
Q
L
 
L
P
 
P
V
 
M
P
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
C
V
 
L
T
 
L
F
 
L
A
 
A
A
 
G
L
 
L
H
 
Y
A
 
A
D
 
R
G
 
G
E
 
K
T
 
T
R
 
C
I
 
I
I
 
T
E
 
E
S
 
P
I
 
A
R
 
P
S
 
S
R
|
R
N
 
D
H
 
H
T
 
T
E
 
E
L
 
R
M
 
L
L
 
L
G
 
K
L
 
H
E
 
F
T
 
H
I
 
Y
D
 
T
R
 
L
P
 
Q
D
 
K
G
 
D
E
 
K
R
 
Q
V
 
S
I
 
I
V
 
C
I
 
V
P
 
S
G
 
G
R
 
G
K
 
G
T
 
K
I
 
L
V
 
K
A
 
A
R
 
N
S
 
D
F
 
I
Y
 
S
I
 
I
P
 
P
A
 
G
D
 
D
P
 
I
S
 
S
A
 
S
A
 
A
C
 
A
F
 
F
I
 
F
V
 
I
A
 
V
L
 
A
G
 
A
L
 
T
L
 
I
G
 
T
S
 
P
N
 
G
S
 
S
E
 
A
I
 
I
I
 
R
I
 
L
R
 
C
D
 
R
V
 
V
C
 
G
L
 
V
N
 
N
P
 
P
T
 
T
R
 
R
V
 
L
E
 
G
F
 
V
I
 
I
P
 
N
L
 
L
L
 
L
T
 
K
G
 
M
A
 
M
G
 
G
A
 
A
D
 
D
I
 
I
T
 
E
I
 
V
E
 
T
N
 
H
S
 
Y
R
 
T
I
 
E
I
 
K
G
 
N
G
 
E
E
 
E
T
 
P
I
 
T
G
 
A
D
 
D
I
 
I
L
 
T
V
 
V
R
 
R
S
 
H
T
 
A
R
 
R
T
 
-
L
 
L
K
 
K
P
 
G
L
 
I
V
 
D
I
 
I
S
 
P
N
 
-
P
 
P
T
 
D
V
 
Q
V
 
V
A
 
P
G
 
L
V
 
T
I
 
I
D
|
D
E
 
E
L
 
F
P
 
P
M
 
V
L
 
L
S
 
L
V
 
I
L
 
A
S
 
A
A
 
A
F
 
V
S
 
A
S
 
Q
G
 
G
E
 
K
F
 
T
E
 
V
L
 
L
H
 
R
N
 
D
A
 
A
E
 
A
E
 
E
L
 
L
R
 
R
T
 
V
K
|
K
E
|
E
S
 
T
D
 
D
R
|
R
I
 
I
N
 
A
A
 
A
I
 
M
V
 
V
V
 
D
N
 
G
L
 
L
E
 
Q
R
 
K
L
 
L
G
 
G
F
 
I
D
 
A
C
 
A
E
 
E
Q
 
S
Y
 
L
P
 
P
D
 
D
G
 
G
F
 
V
R
 
I
V
 
I
I
 
Q
G
 
G
R
 
G
R
 
T
C
 
L
R
 
E
P
 
G
V
 
-
G
 
G
Q
 
E
V
 
V
T
 
N
V
 
-
A
 
-
C
 
S
F
 
Y
D
 
D
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
A
F
 
F
A
 
A
V
 
V
A
 
A
A
 
G
R
 
T
A
 
L
T
 
A
G
 
K
E
 
G
G
 
P
I
 
V
A
 
R
L
 
I
S
 
R
D
 
N
S
 
C
D
 
D
V
 
N
V
 
V
G
 
K
V
x
T
S
 
S
F
 
F
P
 
P
N
 
N
F
 
F
F
 
V
E
 
E
I
 
L

4egrA 2.50 angstrom resolution structure of 3-phosphoshikimate 1- carboxyvinyltransferase (aroa) from coxiella burnetii in complex with phosphoenolpyruvate
39% identity, 98% coverage: 4:428/434 of query aligns to 13:419/434 of 4egrA

query
sites
4egrA
F
 
L
K
 
S
G
 
G
E
 
E
V
 
I
T
 
-
A
 
C
L
 
V
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
 
R
A
 
A
A
 
V
L
 
L
I
 
L
G
 
A
S
 
A
L
 
I
S
 
A
E
 
E
G
 
G
V
 
Q
T
 
T
E
 
Q
I
 
V
T
 
D
N
 
G
F
 
F
S
 
L
A
 
M
G
 
G
F
 
A
D
|
D
N
 
N
Q
 
L
S
 
A
T
 
M
L
 
V
G
 
S
V
 
A
L
 
L
H
 
Q
D
 
Q
A
 
M
G
 
G
-
 
A
-
 
S
I
 
I
E
 
Q
V
 
V
S
 
I
Q
 
E
H
 
D
E
 
E
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
-
G
 
-
R
 
-
R
 
-
I
 
-
R
 
N
K
 
I
V
 
L
I
 
V
I
 
V
S
 
E
S
 
G
R
 
V
G
 
G
L
 
M
W
 
T
S
 
G
F
 
L
T
 
Q
A
 
A
P
 
P
E
 
P
K
 
E
P
 
A
L
 
L
M
 
D
C
 
C
N
 
G
N
|
N
S
 
S
G
|
G
S
x
T
T
 
A
M
 
I
R
 
R
M
 
L
F
 
L
A
 
S
G
 
G
I
 
L
L
 
L
A
 
A
A
 
G
Q
 
Q
P
 
P
F
 
F
E
 
N
S
 
T
E
 
V
L
 
L
V
 
T
G
 
G
D
 
D
S
 
S
S
 
S
L
 
L
M
 
Q
K
 
R
R
|
R
P
 
P
M
 
M
K
 
K
R
 
R
V
 
I
A
 
I
D
 
D
P
 
P
L
 
L
R
 
T
Q
 
L
M
 
M
G
 
G
A
 
A
G
 
K
V
 
I
D
 
D
L
 
-
S
 
S
P
 
T
A
 
G
G
 
N
T
 
V
A
 
P
P
 
P
V
 
L
R
 
K
I
 
I
R
 
Y
G
 
G
T
 
N
R
 
P
D
 
R
L
 
L
T
 
T
P
 
G
L
 
I
E
 
H
Y
 
Y
R
 
Q
L
 
L
P
 
P
V
 
M
P
 
A
S
 
S
A
 
A
Q
 
Q
V
 
V
K
 
K
S
 
S
L
 
C
V
 
L
T
 
L
F
 
L
A
 
A
A
 
G
L
 
L
H
 
Y
A
 
A
D
 
R
G
 
G
E
 
K
T
 
T
R
 
C
I
 
I
I
 
T
E
 
E
S
 
P
I
 
A
R
 
P
S
 
S
R
 
R
N
 
D
H
 
H
T
 
T
E
 
E
L
 
R
M
 
L
L
 
-
G
 
-
L
 
L
E
 
K
T
 
H
I
 
F
D
 
H
R
 
Y
P
 
T
D
 
L
G
 
Q
E
 
K
R
 
Q
V
 
S
I
 
I
V
 
C
I
 
V
P
 
S
G
 
G
R
 
G
K
 
G
T
 
K
I
 
L
V
 
K
A
 
A
R
 
N
S
 
D
F
 
I
Y
 
S
I
 
I
P
 
P
A
 
G
D
 
D
P
 
I
S
 
S
A
 
S
A
 
A
C
 
A
F
 
F
I
 
F
V
 
I
A
 
V
L
 
A
G
 
A
L
 
T
L
 
I
G
 
T
S
 
P
N
 
G
S
 
S
E
 
A
I
 
I
I
 
R
I
 
L
R
 
C
D
 
R
V
 
V
C
 
G
L
 
V
N
 
N
P
 
P
T
 
T
R
 
R
V
 
L
E
 
G
F
 
V
I
 
I
P
 
N
L
 
L
L
 
L
T
 
K
G
 
M
A
 
M
G
 
G
A
 
A
D
 
D
I
 
-
T
 
-
I
 
I
E
 
E
N
 
V
S
 
T
R
 
H
I
 
Y
I
 
T
G
 
E
G
 
K
E
 
E
T
 
P
I
 
T
G
 
A
D
 
D
I
 
I
L
 
T
V
 
V
R
 
R
S
 
H
T
 
A
R
 
R
T
 
-
L
 
L
K
 
K
P
 
G
L
 
I
V
 
D
I
 
I
S
 
P
N
 
-
P
 
P
T
 
D
V
 
Q
V
 
V
A
 
P
G
 
L
V
 
T
I
 
I
D
|
D
E
 
E
L
 
F
P
 
P
M
 
V
L
 
L
S
 
L
V
 
I
L
 
A
S
 
A
A
 
A
F
 
V
S
 
A
S
 
Q
G
 
G
E
 
K
F
 
T
E
 
V
L
 
L
H
 
R
N
 
D
A
 
A
E
 
A
E
 
E
L
 
L
R
 
R
T
 
V
K
 
K
E
|
E
S
 
T
D
 
D
R
|
R
I
 
I
N
 
A
A
 
A
I
 
M
V
 
V
V
 
D
N
 
G
L
 
L
E
 
Q
R
 
K
L
 
L
G
 
G
F
 
I
D
 
A
C
 
A
E
 
E
Q
 
S
Y
 
L
P
 
P
D
 
D
G
 
G
F
 
V
R
 
I
V
 
I
I
 
Q
G
 
G
R
 
G
R
 
T
C
 
L
R
 
E
P
 
G
V
 
-
G
 
G
Q
 
E
V
 
V
T
 
N
V
 
-
A
 
-
C
 
S
F
 
Y
D
 
D
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
A
F
 
F
A
 
A
V
 
V
A
 
A
A
 
G
R
 
T
A
 
L
T
 
A
G
 
K
E
 
G
G
 
P
I
 
V
A
 
R
L
 
I
S
 
R
D
 
N
S
 
C
D
 
D
V
 
N
V
 
V
G
 
K
V
x
T
S
 
S
F
 
F
P
 
P
N
 
N
F
 
F
F
 
V
E
 
E
I
 
L

Q9R4E4 3-phosphoshikimate 1-carboxyvinyltransferase; 5-enolpyruvylshikimate-3-phosphate synthase; EPSP synthase; EPSPS; CP4 EPSP synthase; EC 2.5.1.19 from Agrobacterium sp. (strain CP4) (see paper)
38% identity, 98% coverage: 11:434/434 of query aligns to 24:445/455 of Q9R4E4

query
sites
Q9R4E4
L
 
I
P
 
P
P
 
G
D
 
D
K
 
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
S
A
 
F
L
 
M
I
 
F
G
 
G
S
 
G
L
 
L
S
 
A
E
 
S
G
 
G
V
 
E
T
 
T
E
 
R
I
 
I
T
 
T
N
 
G
F
 
L
S
 
L
A
 
E
G
 
G
F
 
E
D
 
D
N
 
V
Q
 
I
S
 
N
T
 
T
L
 
G
G
 
K
V
 
A
L
 
M
H
 
Q
D
 
-
A
 
-
G
 
-
I
 
-
E
 
-
V
 
-
S
 
-
Q
 
-
H
 
-
E
 
-
I
 
-
D
 
-
G
 
-
A
 
A
Y
 
M
G
 
G
R
 
A
R
 
R
I
 
I
R
 
R
K
 
K
-
 
E
-
 
G
-
 
D
-
 
T
V
 
W
I
 
I
I
 
I
S
 
D
S
 
G
R
 
V
G
 
G
L
 
N
W
 
G
S
 
G
F
 
L
T
 
L
A
 
A
P
 
P
E
 
E
K
 
A
P
 
P
L
 
L
M
 
D
C
 
F
N
 
G
N
 
N
S
 
A
G
x
A
S
 
T
T
 
G
M
 
C
R
 
R
M
 
L
F
 
T
A
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
E
 
D
S
 
S
E
 
T
L
 
F
V
 
I
G
 
G
D
 
D
S
 
A
S
 
S
L
 
L
M
 
T
K
 
K
R
 
R
P
 
P
M
 
M
K
 
G
R
 
R
V
 
V
A
 
L
D
 
N
P
 
P
L
 
L
R
 
R
Q
 
E
M
 
M
G
 
G
A
 
V
G
 
Q
V
 
V
D
 
K
L
 
S
S
 
E
P
 
D
A
 
G
G
 
D
T
 
R
A
 
L
P
 
P
V
 
V
R
 
T
I
 
L
R
 
R
G
 
G
T
 
P
R
 
K
D
 
T
L
 
P
T
 
T
P
 
P
L
 
I
E
 
T
Y
 
Y
R
 
R
L
 
V
P
 
P
V
 
M
P
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
A
V
 
V
T
 
L
F
 
L
A
 
A
A
 
G
L
 
L
H
 
N
A
 
T
D
 
P
G
 
G
E
 
I
T
 
T
R
 
T
I
 
V
I
 
I
E
 
E
S
 
P
I
 
I
R
 
M
S
 
T
R
 
R
N
 
D
H
 
H
T
 
T
E
 
E
L
 
K
M
 
M
L
 
L
-
 
Q
-
 
G
-
 
F
-
 
G
-
 
A
G
 
N
L
 
L
E
 
T
T
 
V
I
 
E
D
 
T
R
 
D
P
 
A
D
 
D
G
 
G
E
 
V
R
 
R
V
 
T
I
 
I
V
 
R
I
 
L
P
 
E
G
 
G
R
 
R
K
 
G
T
 
K
I
 
L
V
 
T
A
 
G
R
 
Q
S
 
V
F
 
I
Y
 
D
I
 
V
P
 
P
A
 
G
D
 
D
P
 
P
S
 
S
A
 
S
A
 
T
C
 
A
F
 
F
I
 
P
V
 
L
A
 
V
L
 
A
G
 
A
L
 
L
L
 
L
G
 
V
S
 
P
N
 
G
S
 
S
E
 
D
I
 
V
I
 
T
I
 
I
R
 
L
D
 
N
V
 
V
C
 
L
L
 
M
N
 
N
P
 
P
T
 
T
R
 
R
V
 
T
E
 
G
F
 
L
I
 
I
P
 
L
L
 
T
L
 
L
T
 
Q
G
 
E
A
 
M
G
 
G
A
 
A
D
 
D
I
 
I
T
 
E
I
 
V
E
 
I
N
 
N
S
 
P
R
 
R
I
 
L
I
 
A
G
 
G
G
 
G
E
 
E
T
 
D
I
 
V
G
 
A
D
 
D
I
 
L
L
 
R
V
 
V
R
 
R
S
 
S
T
 
S
R
 
-
T
 
T
L
 
L
K
 
K
P
 
G
L
 
V
V
 
T
I
 
V
S
 
P
N
 
E
P
 
D
T
 
R
V
 
A
V
 
P
A
 
S
G
 
-
V
 
M
I
 
I
D
|
D
E
 
E
L
 
Y
P
 
P
M
 
I
L
 
L
S
 
A
V
 
V
L
 
A
S
 
A
A
 
A
F
 
F
S
 
A
S
 
E
G
 
G
E
 
A
F
 
T
E
 
V
L
 
M
H
 
N
N
 
G
A
 
L
E
 
E
E
 
E
L
 
L
R
 
R
T
 
V
K
|
K
E
 
E
S
 
S
D
 
D
R
 
R
I
 
L
N
 
S
A
 
A
I
 
V
V
 
A
V
 
N
N
 
G
L
 
L
E
 
K
R
 
L
L
 
N
G
 
G
F
 
V
D
 
D
C
 
C
E
 
D
Q
 
E
Y
 
G
P
 
E
D
 
T
G
 
S
F
 
L
R
 
V
V
 
V
I
 
-
G
 
-
R
 
-
R
 
R
C
 
G
R
 
R
P
 
P
V
 
D
G
 
G
Q
 
K
-
 
G
-
 
L
-
 
G
-
 
N
-
 
A
-
 
S
-
 
G
V
 
A
T
 
A
V
 
V
A
 
A
C
 
T
F
 
H
D
 
L
D
 
D
H
 
H
R
 
R
I
 
I
A
 
A
M
 
M
S
 
S
F
 
F
A
 
L
V
 
V
A
 
M
A
 
G
R
 
L
A
 
V
T
 
S
G
 
E
E
 
N
G
 
P
I
 
V
A
 
T
L
 
V
S
 
D
D
 
D
S
 
A
D
 
T
V
 
M
V
 
I
G
 
A
V
 
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
F
 
M
E
 
D
I
 
L
I
 
M
E
 
A
N
 
G
L
 
L
K
 
G
A
 
A

2pqcA Cp4 epsps liganded with (r)-phosphonate tetrahedral reaction intermediate analog (see paper)
38% identity, 98% coverage: 11:434/434 of query aligns to 19:440/445 of 2pqcA

query
sites
2pqcA
L
 
I
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
S
A
 
F
L
 
M
I
 
F
G
 
G
S
 
G
L
 
L
S
 
A
E
 
S
G
 
G
V
 
E
T
 
T
E
 
R
I
 
I
T
 
T
N
 
G
F
 
L
S
 
L
A
 
E
G
 
G
F
 
E
D
|
D
N
 
V
Q
 
I
S
 
N
T
 
T
L
 
G
G
 
K
V
 
A
L
 
M
H
 
Q
D
 
-
A
 
-
G
 
-
I
 
-
E
 
-
V
 
-
S
 
-
Q
 
-
H
 
-
E
 
-
I
 
-
D
 
-
G
 
-
A
 
A
Y
 
M
G
 
G
R
 
A
R
 
R
I
 
I
R
 
R
K
 
K
-
 
E
-
 
G
-
 
D
-
 
T
V
 
W
I
 
I
I
 
I
S
 
D
S
 
G
R
 
V
G
 
G
L
 
N
W
 
G
S
 
G
F
 
L
T
 
L
A
 
A
P
 
P
E
 
E
K
 
A
P
 
P
L
 
L
M
 
D
C
 
F
N
 
G
N
|
N
S
 
A
G
 
A
S
x
T
T
 
G
M
 
C
R
 
R
M
 
L
F
 
T
A
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
E
 
D
S
 
S
E
 
T
L
 
F
V
 
I
G
 
G
D
 
D
S
 
A
S
 
S
L
 
L
M
 
T
K
 
K
R
|
R
P
 
P
M
 
M
K
 
G
R
 
R
V
 
V
A
 
L
D
 
N
P
 
P
L
 
L
R
 
R
Q
 
E
M
 
M
G
 
G
A
 
V
G
 
Q
V
 
V
D
 
K
L
 
S
S
 
E
P
 
D
A
 
G
G
 
D
T
 
R
A
 
L
P
 
P
V
 
V
R
 
T
I
 
L
R
 
R
G
 
G
T
 
P
R
 
K
D
 
T
L
 
P
T
 
T
P
 
P
L
 
I
E
 
T
Y
 
Y
R
 
R
L
 
V
P
 
P
V
 
M
P
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
A
V
 
V
T
 
L
F
 
L
A
 
A
A
 
G
L
 
L
H
 
N
A
 
T
D
 
P
G
 
G
E
 
I
T
 
T
R
 
T
I
 
V
I
 
I
E
 
E
S
 
P
I
 
I
R
 
M
S
 
T
R
 
R
N
 
D
H
 
H
T
 
T
E
 
E
L
 
K
M
 
M
L
 
L
-
 
Q
-
 
G
-
 
F
-
 
G
-
 
A
G
 
N
L
 
L
E
 
T
T
 
V
I
 
E
D
 
T
R
 
D
P
 
A
D
 
D
G
 
G
E
 
V
R
 
R
V
 
T
I
 
I
V
 
R
I
 
L
P
 
E
G
 
G
R
 
R
K
 
G
T
 
K
I
 
L
V
 
T
A
 
G
R
 
Q
S
 
V
F
 
I
Y
 
D
I
 
V
P
 
P
A
 
G
D
 
D
P
 
P
S
 
S
A
 
S
A
 
T
C
 
A
F
 
F
I
 
P
V
 
L
A
 
V
L
 
A
G
 
A
L
 
L
L
 
L
G
 
V
S
 
P
N
 
G
S
 
S
E
 
D
I
 
V
I
 
T
I
 
I
R
 
L
D
 
N
V
 
V
C
 
L
L
 
M
N
 
N
P
 
P
T
 
T
R
 
R
V
 
T
E
 
G
F
 
L
I
 
I
P
 
L
L
 
T
L
 
L
T
 
Q
G
 
E
A
 
M
G
 
G
A
 
A
D
 
D
I
 
I
T
 
E
I
 
V
E
 
I
N
 
N
S
 
P
R
 
R
I
 
L
I
 
A
G
 
G
G
 
G
E
 
E
T
 
D
I
 
V
G
 
A
D
 
D
I
 
L
L
 
R
V
 
V
R
 
R
S
 
S
T
 
S
R
 
-
T
 
T
L
 
L
K
 
K
P
 
G
L
 
V
V
 
T
I
 
V
S
 
P
N
 
E
P
 
D
T
 
R
V
 
A
V
 
P
A
 
S
G
 
-
V
 
M
I
 
I
D
|
D
E
 
E
L
 
Y
P
 
P
M
 
I
L
 
L
S
 
A
V
 
V
L
 
A
S
 
A
A
 
A
F
 
F
S
 
A
S
 
E
G
 
G
E
 
A
F
 
T
E
 
V
L
 
M
H
 
N
N
 
G
A
 
L
E
 
E
E
 
E
L
 
L
R
 
R
T
 
V
K
|
K
E
|
E
S
 
S
D
 
D
R
|
R
I
 
L
N
 
S
A
 
A
I
 
V
V
 
A
V
 
N
N
 
G
L
 
L
E
 
K
R
 
L
L
 
N
G
 
G
F
 
V
D
 
D
C
 
C
E
 
D
Q
 
E
Y
 
G
P
 
E
D
 
T
G
 
S
F
 
L
R
 
V
V
 
V
I
 
-
G
 
-
R
 
-
R
 
R
C
 
G
R
 
R
P
 
P
V
 
D
G
 
G
Q
 
K
-
 
G
-
 
L
-
 
G
-
 
N
-
 
A
-
 
S
-
 
G
V
 
A
T
 
A
V
 
V
A
 
A
C
 
T
F
 
H
D
 
L
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
S
F
 
F
A
 
L
V
 
V
A
 
M
A
 
G
R
 
L
A
 
V
T
 
S
G
 
E
E
 
N
G
 
P
I
 
V
A
 
T
L
 
V
S
 
D
D
 
D
S
 
A
D
 
T
V
 
M
V
 
I
G
 
A
V
x
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
F
 
M
E
 
D
I
 
L
I
 
M
E
 
A
N
 
G
L
 
L
K
 
G
A
 
A

2pqbA Cp4 epsps liganded with (r)-difluoromethyl tetrahedral intermediate analog (see paper)
38% identity, 98% coverage: 11:434/434 of query aligns to 19:440/445 of 2pqbA

query
sites
2pqbA
L
 
I
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
S
A
 
F
L
 
M
I
 
F
G
 
G
S
 
G
L
 
L
S
 
A
E
 
S
G
 
G
V
 
E
T
 
T
E
 
R
I
 
I
T
 
T
N
 
G
F
 
L
S
 
L
A
 
E
G
 
G
F
 
E
D
|
D
N
 
V
Q
 
I
S
 
N
T
 
T
L
 
G
G
 
K
V
 
A
L
 
M
H
 
Q
D
 
-
A
 
-
G
 
-
I
 
-
E
 
-
V
 
-
S
 
-
Q
 
-
H
 
-
E
 
-
I
 
-
D
 
-
G
 
-
A
 
A
Y
 
M
G
 
G
R
 
A
R
 
R
I
 
I
R
 
R
K
 
K
-
 
E
-
 
G
-
 
D
-
 
T
V
 
W
I
 
I
I
 
I
S
 
D
S
 
G
R
 
V
G
 
G
L
 
N
W
 
G
S
 
G
F
 
L
T
 
L
A
 
A
P
 
P
E
 
E
K
 
A
P
 
P
L
 
L
M
 
D
C
 
F
N
 
G
N
|
N
S
 
A
G
x
A
S
x
T
T
 
G
M
 
C
R
 
R
M
 
L
F
 
T
A
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
E
 
D
S
 
S
E
 
T
L
 
F
V
 
I
G
 
G
D
 
D
S
 
A
S
 
S
L
 
L
M
 
T
K
 
K
R
|
R
P
 
P
M
 
M
K
 
G
R
 
R
V
 
V
A
 
L
D
 
N
P
 
P
L
 
L
R
 
R
Q
 
E
M
 
M
G
 
G
A
 
V
G
 
Q
V
 
V
D
 
K
L
 
S
S
 
E
P
 
D
A
 
G
G
 
D
T
 
R
A
 
L
P
 
P
V
 
V
R
 
T
I
 
L
R
 
R
G
 
G
T
 
P
R
 
K
D
 
T
L
 
P
T
 
T
P
 
P
L
 
I
E
 
T
Y
 
Y
R
 
R
L
 
V
P
 
P
V
 
M
P
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
A
V
 
V
T
 
L
F
 
L
A
 
A
A
 
G
L
 
L
H
 
N
A
 
T
D
 
P
G
 
G
E
 
I
T
 
T
R
 
T
I
 
V
I
 
I
E
 
E
S
 
P
I
 
I
R
 
M
S
 
T
R
 
R
N
 
D
H
 
H
T
 
T
E
 
E
L
 
K
M
 
M
L
 
L
-
 
Q
-
 
G
-
 
F
-
 
G
-
 
A
G
 
N
L
 
L
E
 
T
T
 
V
I
 
E
D
 
T
R
 
D
P
 
A
D
 
D
G
 
G
E
 
V
R
 
R
V
 
T
I
 
I
V
 
R
I
 
L
P
 
E
G
 
G
R
 
R
K
 
G
T
 
K
I
 
L
V
 
T
A
 
G
R
 
Q
S
 
V
F
 
I
Y
 
D
I
 
V
P
 
P
A
 
G
D
 
D
P
 
P
S
 
S
A
 
S
A
 
T
C
 
A
F
 
F
I
 
P
V
 
L
A
 
V
L
 
A
G
 
A
L
 
L
L
 
L
G
 
V
S
 
P
N
 
G
S
 
S
E
 
D
I
 
V
I
 
T
I
 
I
R
 
L
D
 
N
V
 
V
C
 
L
L
 
M
N
 
N
P
 
P
T
 
T
R
 
R
V
 
T
E
 
G
F
 
L
I
 
I
P
 
L
L
 
T
L
 
L
T
 
Q
G
 
E
A
 
M
G
 
G
A
 
A
D
 
D
I
 
I
T
 
E
I
 
V
E
 
I
N
 
N
S
 
P
R
 
R
I
 
L
I
 
A
G
 
G
G
 
G
E
 
E
T
 
D
I
 
V
G
 
A
D
 
D
I
 
L
L
 
R
V
 
V
R
 
R
S
 
S
T
 
S
R
 
-
T
 
T
L
 
L
K
 
K
P
 
G
L
 
V
V
 
T
I
 
V
S
 
P
N
 
E
P
 
D
T
 
R
V
 
A
V
 
P
A
 
S
G
 
-
V
 
M
I
 
I
D
|
D
E
 
E
L
 
Y
P
 
P
M
 
I
L
 
L
S
 
A
V
 
V
L
 
A
S
 
A
A
 
A
F
 
F
S
 
A
S
 
E
G
 
G
E
 
A
F
 
T
E
 
V
L
 
M
H
 
N
N
 
G
A
 
L
E
 
E
E
 
E
L
 
L
R
 
R
T
 
V
K
|
K
E
|
E
S
 
S
D
 
D
R
|
R
I
 
L
N
 
S
A
 
A
I
 
V
V
 
A
V
 
N
N
 
G
L
 
L
E
 
K
R
 
L
L
 
N
G
 
G
F
 
V
D
 
D
C
 
C
E
 
D
Q
 
E
Y
 
G
P
 
E
D
 
T
G
 
S
F
 
L
R
 
V
V
 
V
I
 
-
G
 
-
R
 
-
R
 
R
C
 
G
R
 
R
P
 
P
V
 
D
G
 
G
Q
 
K
-
 
G
-
 
L
-
 
G
-
 
N
-
 
A
-
 
S
-
 
G
V
 
A
T
 
A
V
 
V
A
 
A
C
 
T
F
 
H
D
 
L
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
S
F
 
F
A
 
L
V
 
V
A
 
M
A
 
G
R
 
L
A
 
V
T
 
S
G
 
E
E
 
N
G
 
P
I
 
V
A
 
T
L
 
V
S
 
D
D
 
D
S
 
A
D
 
T
V
 
M
V
 
I
G
 
A
V
x
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
F
 
M
E
 
D
I
 
L
I
 
M
E
 
A
N
 
G
L
 
L
K
 
G
A
 
A

2ggaA Cp4 epsp synthase liganded with s3p and glyphosate (see paper)
38% identity, 98% coverage: 11:434/434 of query aligns to 19:440/445 of 2ggaA

query
sites
2ggaA
L
 
I
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
S
A
 
F
L
 
M
I
 
F
G
 
G
S
 
G
L
 
L
S
 
A
E
 
S
G
 
G
V
 
E
T
 
T
E
 
R
I
 
I
T
 
T
N
 
G
F
 
L
S
 
L
A
 
E
G
 
G
F
 
E
D
|
D
N
 
V
Q
 
I
S
 
N
T
 
T
L
 
G
G
 
K
V
 
A
L
 
M
H
 
Q
D
 
-
A
 
-
G
 
-
I
 
-
E
 
-
V
 
-
S
 
-
Q
 
-
H
 
-
E
 
-
I
 
-
D
 
-
G
 
-
A
 
A
Y
 
M
G
 
G
R
 
A
R
 
R
I
 
I
R
 
R
K
 
K
-
 
E
-
 
G
-
 
D
-
 
T
V
 
W
I
 
I
I
 
I
S
 
D
S
 
G
R
 
V
G
 
G
L
 
N
W
 
G
S
 
G
F
 
L
T
 
L
A
 
A
P
 
P
E
 
E
K
 
A
P
 
P
L
 
L
M
 
D
C
 
F
N
 
G
N
|
N
S
x
A
G
x
A
S
x
T
T
 
G
M
 
C
R
 
R
M
 
L
F
 
T
A
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
E
 
D
S
 
S
E
 
T
L
 
F
V
 
I
G
 
G
D
 
D
S
 
A
S
 
S
L
 
L
M
 
T
K
 
K
R
|
R
P
 
P
M
 
M
K
 
G
R
 
R
V
 
V
A
 
L
D
 
N
P
 
P
L
 
L
R
 
R
Q
 
E
M
 
M
G
 
G
A
 
V
G
 
Q
V
 
V
D
 
K
L
 
S
S
 
E
P
 
D
A
 
G
G
 
D
T
 
R
A
 
L
P
 
P
V
 
V
R
 
T
I
 
L
R
 
R
G
 
G
T
 
P
R
 
K
D
 
T
L
 
P
T
 
T
P
 
P
L
 
I
E
 
T
Y
 
Y
R
 
R
L
 
V
P
 
P
V
 
M
P
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
A
V
 
V
T
 
L
F
 
L
A
 
A
A
 
G
L
 
L
H
 
N
A
 
T
D
 
P
G
 
G
E
 
I
T
 
T
R
 
T
I
 
V
I
 
I
E
 
E
S
 
P
I
 
I
R
 
M
S
 
T
R
|
R
N
 
D
H
 
H
T
 
T
E
 
E
L
 
K
M
 
M
L
 
L
-
 
Q
-
 
G
-
 
F
-
 
G
-
 
A
G
 
N
L
 
L
E
 
T
T
 
V
I
 
E
D
 
T
R
 
D
P
 
A
D
 
D
G
 
G
E
 
V
R
 
R
V
 
T
I
 
I
V
 
R
I
 
L
P
 
E
G
 
G
R
 
R
K
 
G
T
 
K
I
 
L
V
 
T
A
 
G
R
 
Q
S
 
V
F
 
I
Y
 
D
I
 
V
P
 
P
A
 
G
D
 
D
P
 
P
S
 
S
A
 
S
A
 
T
C
 
A
F
 
F
I
 
P
V
 
L
A
 
V
L
 
A
G
 
A
L
 
L
L
 
L
G
 
V
S
 
P
N
 
G
S
 
S
E
 
D
I
 
V
I
 
T
I
 
I
R
 
L
D
 
N
V
 
V
C
 
L
L
 
M
N
 
N
P
 
P
T
 
T
R
 
R
V
 
T
E
 
G
F
 
L
I
 
I
P
 
L
L
 
T
L
 
L
T
 
Q
G
 
E
A
 
M
G
 
G
A
 
A
D
 
D
I
 
I
T
 
E
I
 
V
E
 
I
N
 
N
S
 
P
R
 
R
I
 
L
I
 
A
G
 
G
G
 
G
E
 
E
T
 
D
I
 
V
G
 
A
D
 
D
I
 
L
L
 
R
V
 
V
R
 
R
S
 
S
T
 
S
R
 
-
T
 
T
L
 
L
K
 
K
P
 
G
L
 
V
V
 
T
I
 
V
S
 
P
N
 
E
P
 
D
T
 
R
V
 
A
V
 
P
A
 
S
G
 
-
V
 
M
I
 
I
D
|
D
E
 
E
L
 
Y
P
 
P
M
 
I
L
 
L
S
 
A
V
 
V
L
 
A
S
 
A
A
 
A
F
 
F
S
 
A
S
 
E
G
 
G
E
 
A
F
 
T
E
 
V
L
 
M
H
 
N
N
 
G
A
 
L
E
 
E
E
 
E
L
 
L
R
 
R
T
 
V
K
|
K
E
|
E
S
 
S
D
 
D
R
|
R
I
 
L
N
 
S
A
 
A
I
 
V
V
 
A
V
 
N
N
 
G
L
 
L
E
 
K
R
 
L
L
 
N
G
 
G
F
 
V
D
 
D
C
 
C
E
 
D
Q
 
E
Y
 
G
P
 
E
D
 
T
G
 
S
F
 
L
R
 
V
V
 
V
I
 
-
G
 
-
R
 
-
R
 
R
C
 
G
R
 
R
P
 
P
V
 
D
G
 
G
Q
 
K
-
 
G
-
 
L
-
 
G
-
 
N
-
 
A
-
 
S
-
 
G
V
 
A
T
 
A
V
 
V
A
 
A
C
 
T
F
 
H
D
 
L
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
S
F
 
F
A
 
L
V
 
V
A
 
M
A
 
G
R
 
L
A
 
V
T
 
S
G
 
E
E
 
N
G
 
P
I
 
V
A
 
T
L
 
V
S
 
D
D
 
D
S
 
A
D
 
T
V
 
M
V
 
I
G
 
A
V
x
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
F
 
M
E
 
D
I
 
L
I
 
M
E
 
A
N
 
G
L
 
L
K
 
G
A
 
A

2gg6A Cp4 epsp synthase liganded with s3p (see paper)
38% identity, 98% coverage: 11:434/434 of query aligns to 19:440/445 of 2gg6A

query
sites
2gg6A
L
 
I
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
S
A
 
F
L
 
M
I
 
F
G
 
G
S
 
G
L
 
L
S
 
A
E
 
S
G
 
G
V
 
E
T
 
T
E
 
R
I
 
I
T
 
T
N
 
G
F
 
L
S
 
L
A
 
E
G
 
G
F
 
E
D
|
D
N
 
V
Q
 
I
S
 
N
T
 
T
L
 
G
G
 
K
V
 
A
L
 
M
H
 
Q
D
 
-
A
 
-
G
 
-
I
 
-
E
 
-
V
 
-
S
 
-
Q
 
-
H
 
-
E
 
-
I
 
-
D
 
-
G
 
-
A
 
A
Y
 
M
G
 
G
R
 
A
R
 
R
I
 
I
R
 
R
K
 
K
-
 
E
-
 
G
-
 
D
-
 
T
V
 
W
I
 
I
I
 
I
S
 
D
S
 
G
R
 
V
G
 
G
L
 
N
W
 
G
S
 
G
F
 
L
T
 
L
A
 
A
P
 
P
E
 
E
K
 
A
P
 
P
L
 
L
M
 
D
C
 
F
N
 
G
N
|
N
S
 
A
G
 
A
S
x
T
T
 
G
M
 
C
R
 
R
M
 
L
F
 
T
A
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
E
 
D
S
 
S
E
 
T
L
 
F
V
 
I
G
 
G
D
 
D
S
 
A
S
 
S
L
 
L
M
 
T
K
 
K
R
|
R
P
 
P
M
 
M
K
 
G
R
 
R
V
 
V
A
 
L
D
 
N
P
 
P
L
 
L
R
 
R
Q
 
E
M
 
M
G
 
G
A
 
V
G
 
Q
V
 
V
D
 
K
L
 
S
S
 
E
P
 
D
A
 
G
G
 
D
T
 
R
A
 
L
P
 
P
V
 
V
R
 
T
I
 
L
R
 
R
G
 
G
T
 
P
R
 
K
D
 
T
L
 
P
T
 
T
P
 
P
L
 
I
E
 
T
Y
 
Y
R
 
R
L
 
V
P
 
P
V
 
M
P
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
A
V
 
V
T
 
L
F
 
L
A
 
A
A
 
G
L
 
L
H
 
N
A
 
T
D
 
P
G
 
G
E
 
I
T
 
T
R
 
T
I
 
V
I
 
I
E
 
E
S
 
P
I
 
I
R
 
M
S
 
T
R
 
R
N
 
D
H
 
H
T
 
T
E
 
E
L
 
K
M
 
M
L
 
L
-
 
Q
-
 
G
-
 
F
-
 
G
-
 
A
G
 
N
L
 
L
E
 
T
T
 
V
I
 
E
D
 
T
R
 
D
P
 
A
D
 
D
G
 
G
E
 
V
R
 
R
V
 
T
I
 
I
V
 
R
I
 
L
P
 
E
G
 
G
R
 
R
K
 
G
T
 
K
I
 
L
V
 
T
A
 
G
R
 
Q
S
 
V
F
 
I
Y
 
D
I
 
V
P
 
P
A
 
G
D
 
D
P
 
P
S
 
S
A
 
S
A
 
T
C
 
A
F
 
F
I
 
P
V
 
L
A
 
V
L
 
A
G
 
A
L
 
L
L
 
L
G
 
V
S
 
P
N
 
G
S
 
S
E
 
D
I
 
V
I
 
T
I
 
I
R
 
L
D
 
N
V
 
V
C
 
L
L
 
M
N
 
N
P
 
P
T
 
T
R
 
R
V
 
T
E
 
G
F
 
L
I
 
I
P
 
L
L
 
T
L
 
L
T
 
Q
G
 
E
A
 
M
G
 
G
A
 
A
D
 
D
I
 
I
T
 
E
I
 
V
E
 
I
N
 
N
S
 
P
R
 
R
I
 
L
I
 
A
G
 
G
G
 
G
E
 
E
T
 
D
I
 
V
G
 
A
D
 
D
I
 
L
L
 
R
V
 
V
R
 
R
S
 
S
T
 
S
R
 
-
T
 
T
L
 
L
K
 
K
P
 
G
L
 
V
V
 
T
I
 
V
S
 
P
N
 
E
P
 
D
T
 
R
V
 
A
V
 
P
A
 
S
G
 
-
V
 
M
I
 
I
D
|
D
E
 
E
L
 
Y
P
 
P
M
 
I
L
 
L
S
 
A
V
 
V
L
 
A
S
 
A
A
 
A
F
 
F
S
 
A
S
 
E
G
 
G
E
 
A
F
 
T
E
 
V
L
 
M
H
 
N
N
 
G
A
 
L
E
 
E
E
 
E
L
 
L
R
 
R
T
 
V
K
|
K
E
|
E
S
 
S
D
 
D
R
 
R
I
 
L
N
 
S
A
 
A
I
 
V
V
 
A
V
 
N
N
 
G
L
 
L
E
 
K
R
 
L
L
 
N
G
 
G
F
 
V
D
 
D
C
 
C
E
 
D
Q
 
E
Y
 
G
P
 
E
D
 
T
G
 
S
F
 
L
R
 
V
V
 
V
I
 
-
G
 
-
R
 
-
R
 
R
C
 
G
R
 
R
P
 
P
V
 
D
G
 
G
Q
 
K
-
 
G
-
 
L
-
 
G
-
 
N
-
 
A
-
 
S
-
 
G
V
 
A
T
 
A
V
 
V
A
 
A
C
 
T
F
 
H
D
 
L
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
S
F
 
F
A
 
L
V
 
V
A
 
M
A
 
G
R
 
L
A
 
V
T
 
S
G
 
E
E
 
N
G
 
P
I
 
V
A
 
T
L
 
V
S
 
D
D
 
D
S
 
A
D
 
T
V
 
M
V
 
I
G
 
A
V
x
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
F
 
M
E
 
D
I
 
L
I
 
M
E
 
A
N
 
G
L
 
L
K
 
G
A
 
A

Q9S400 3-phosphoshikimate 1-carboxyvinyltransferase; 5-enolpyruvylshikimate-3-phosphate synthase; EPSP synthase; EPSPS; EC 2.5.1.19 from Streptococcus pneumoniae serotype 4 (strain ATCC BAA-334 / TIGR4) (see paper)
35% identity, 97% coverage: 11:432/434 of query aligns to 16:424/427 of Q9S400

query
sites
Q9S400
L
 
V
P
 
P
P
 
G
D
 
D
K
 
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
S
A
 
I
L
 
I
I
 
F
G
 
G
S
 
S
L
 
L
S
 
A
E
 
E
G
 
G
V
 
E
T
 
T
E
 
K
I
 
V
T
 
Y
N
 
D
F
 
I
S
 
L
A
 
R
G
 
G
F
 
E
D
 
D
N
 
V
Q
 
L
S
 
S
T
 
T
L
 
M
G
 
Q
V
 
V
L
 
F
H
 
R
D
 
D
A
 
L
G
 
G
I
 
V
E
 
E
V
 
I
S
 
E
Q
 
D
H
 
K
E
 
-
I
 
-
D
 
D
G
 
G
A
 
V
Y
 
-
G
 
-
R
 
-
R
 
-
I
 
-
R
 
-
K
 
-
V
 
I
I
 
T
I
 
I
S
 
Q
S
 
G
R
 
V
G
 
G
L
 
M
W
 
A
S
 
G
F
 
L
T
 
K
A
 
A
P
 
P
E
 
Q
K
 
N
P
 
A
L
 
L
M
 
N
C
 
M
N
 
G
N
 
N
S
 
S
G
 
G
S
 
T
T
 
S
M
 
I
R
 
R
M
 
L
F
 
I
A
 
S
G
 
G
I
 
V
L
 
L
A
 
A
A
 
G
Q
 
A
P
 
D
F
 
F
E
 
E
S
 
V
E
 
E
L
 
M
V
 
F
G
 
G
D
 
D
S
 
D
S
 
S
L
 
L
M
 
S
K
 
K
R
 
R
P
 
P
M
 
M
K
 
D
R
 
R
V
 
V
A
 
T
D
 
L
P
 
P
L
 
L
R
 
K
Q
 
K
M
 
M
G
 
G
A
 
V
G
 
S
V
 
I
D
 
S
-
 
G
L
 
Q
S
 
T
P
 
E
A
 
R
G
 
D
T
 
L
A
 
P
P
 
P
V
 
L
R
 
R
I
 
L
R
 
K
G
 
G
T
 
T
R
 
K
D
 
N
L
 
L
T
 
R
P
 
P
L
 
I
E
 
H
Y
 
Y
R
 
E
L
 
L
P
 
P
V
 
I
P
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
A
V
 
L
T
 
M
F
 
F
A
 
A
A
 
A
L
 
L
H
 
Q
A
 
A
D
 
K
G
 
G
E
 
E
T
 
S
R
 
V
I
 
I
I
 
I
E
 
E
S
 
K
I
 
E
R
 
Y
S
 
T
R
 
R
N
 
N
H
 
H
T
 
T
E
 
E
L
 
D
M
 
M
L
 
L
-
 
K
-
 
Q
-
 
F
-
 
G
G
 
G
L
 
H
E
 
L
T
 
S
I
 
V
D
 
-
R
 
-
P
 
-
D
 
D
G
 
G
E
 
K
R
 
K
V
 
-
I
 
I
V
 
T
I
 
V
P
 
Q
G
 
G
R
 
P
K
 
Q
T
 
K
I
 
L
V
 
T
A
 
G
R
 
Q
S
 
K
F
 
V
Y
 
V
I
 
V
P
 
P
A
 
G
D
 
D
P
 
I
S
 
S
A
 
S
A
 
A
C
 
A
F
 
F
I
 
W
V
 
L
A
 
V
L
 
A
G
 
G
L
 
L
L
 
I
G
 
A
S
 
P
N
 
N
S
 
S
E
 
R
I
 
L
I
 
V
I
 
L
R
 
Q
D
 
N
V
 
V
C
 
G
L
 
I
N
 
N
P
 
E
T
 
T
R
 
R
V
 
T
E
 
G
F
 
I
I
 
I
P
 
D
L
 
V
L
 
I
T
 
R
G
 
A
A
 
M
G
 
G
A
 
G
D
 
K
I
 
L
T
 
E
I
 
I
E
 
T
N
 
E
S
 
I
R
 
D
I
 
P
I
 
V
G
 
A
G
 
K
E
 
S
T
 
A
I
 
-
G
 
-
D
 
-
I
 
T
L
 
L
V
 
I
R
 
V
S
 
E
T
 
S
R
 
S
T
 
D
L
 
L
K
 
K
P
 
G
L
 
T
V
 
E
I
 
I
S
 
G
N
 
G
P
 
-
T
 
A
V
 
L
V
 
I
A
 
P
G
 
R
V
 
L
I
 
I
D
|
D
E
 
E
L
 
L
P
 
P
M
 
I
L
 
I
S
 
A
V
 
L
L
 
L
S
 
A
A
 
T
F
 
Q
S
 
A
S
 
Q
G
 
G
E
 
V
F
 
T
E
 
V
L
 
I
H
 
K
N
 
D
A
 
A
E
 
E
E
 
E
L
 
L
R
 
K
T
 
V
K
|
K
E
 
E
S
 
T
D
 
D
R
 
R
I
 
I
N
 
Q
A
 
V
I
 
V
V
 
A
V
 
D
N
 
A
L
 
L
E
 
N
R
 
S
L
 
M
G
 
G
F
 
A
D
 
D
C
 
I
E
 
T
Q
 
P
Y
 
T
P
 
A
D
 
D
G
 
G
F
 
M
R
 
I
V
 
I
I
 
K
G
 
G
R
 
K
R
 
S
C
 
A
R
 
L
P
 
H
V
 
G
G
 
A
Q
 
R
V
 
V
T
 
N
V
 
-
A
 
-
C
 
T
F
 
F
D
 
G
D
 
D
H
 
H
R
 
R
I
 
I
A
 
G
M
 
M
S
 
M
F
 
T
A
 
A
V
 
I
A
 
A
A
 
A
R
 
L
A
 
L
T
 
V
G
 
A
E
 
D
G
 
G
-
 
E
I
 
V
A
 
E
L
 
L
S
 
D
D
 
R
S
 
A
D
 
E
V
 
A
V
 
I
G
 
N
V
 
T
S
 
S
F
 
Y
P
 
P
N
 
S
F
 
F
F
 
F
E
 
D
I
 
D
I
 
L
E
 
E
N
 
S
L
 
L

1rf6A Structural studies of streptococcus pneumoniae epsp synthase in s3p- glp bound state (see paper)
34% identity, 97% coverage: 11:432/434 of query aligns to 16:424/427 of 1rf6A

query
sites
1rf6A
L
 
V
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
S
A
 
I
L
 
I
I
 
F
G
 
G
S
 
S
L
 
L
S
 
A
E
 
E
G
 
G
V
 
E
T
 
T
E
 
K
I
 
V
T
 
Y
N
 
D
F
 
I
S
 
L
A
 
R
G
 
G
F
 
E
D
|
D
N
 
V
Q
 
L
S
 
S
T
 
T
L
 
M
G
 
Q
V
 
V
L
 
F
H
 
R
D
 
D
A
 
L
G
 
G
I
 
V
E
 
E
V
 
I
S
 
E
Q
 
D
H
 
K
E
 
-
I
 
-
D
 
D
G
 
G
A
 
V
Y
 
-
G
 
-
R
 
-
R
 
-
I
 
-
R
 
-
K
 
-
V
 
I
I
 
T
I
 
V
S
 
Q
S
 
G
R
 
V
G
 
G
L
 
M
W
 
A
S
 
G
F
 
L
T
 
K
A
 
A
P
 
P
E
 
Q
K
 
N
P
 
A
L
 
L
M
 
N
C
 
M
N
 
G
N
|
N
S
 
S
G
|
G
S
x
T
T
 
S
M
 
I
R
 
R
M
 
L
F
 
I
A
 
S
G
 
G
I
 
V
L
 
L
A
 
A
A
 
G
Q
 
A
P
 
D
F
 
F
E
 
E
S
 
V
E
 
E
L
 
M
V
 
F
G
 
G
D
 
D
S
x
D
S
 
S
L
 
L
M
 
S
K
 
K
R
|
R
P
 
P
M
 
M
K
 
D
R
 
R
V
 
V
A
 
T
D
 
L
P
 
P
L
 
L
R
 
K
Q
 
K
M
 
M
G
 
G
A
 
V
G
 
S
V
 
I
D
 
S
-
 
G
L
 
Q
S
 
T
P
 
E
A
 
R
G
 
D
T
 
L
A
 
P
P
 
P
V
 
L
R
 
R
I
 
L
R
 
K
G
 
G
T
 
T
R
 
K
D
 
N
L
 
L
T
 
R
P
 
P
L
 
I
E
 
H
Y
 
Y
R
 
E
L
 
L
P
 
P
V
 
I
P
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
A
V
 
L
T
 
M
F
 
F
A
 
A
A
 
A
L
 
L
H
 
Q
A
 
A
D
 
K
G
 
G
E
 
E
T
 
S
R
 
V
I
 
I
I
 
I
E
 
E
S
 
K
I
 
E
R
 
Y
S
 
T
R
|
R
N
 
N
H
 
H
T
 
T
E
 
E
L
 
D
M
 
M
L
 
L
-
 
Q
-
 
Q
-
 
F
-
 
G
G
 
G
L
 
H
E
 
L
T
 
S
I
 
V
D
 
-
R
 
-
P
 
-
D
 
D
G
 
G
E
 
K
R
 
K
V
 
-
I
 
I
V
 
T
I
 
V
P
 
Q
G
 
G
R
 
P
K
 
Q
T
 
K
I
 
L
V
 
T
A
 
G
R
 
Q
S
 
K
F
 
V
Y
 
V
I
 
V
P
 
P
A
 
G
D
 
D
P
 
I
S
 
S
A
 
S
A
 
A
C
 
A
F
 
F
I
 
W
V
 
L
A
 
V
L
 
A
G
 
G
L
 
L
L
 
I
G
 
A
S
 
P
N
 
N
S
 
S
E
 
R
I
 
L
I
 
V
I
 
L
R
 
Q
D
 
N
V
 
V
C
 
G
L
 
I
N
 
N
P
 
E
T
 
T
R
 
R
V
 
T
E
 
G
F
 
I
I
 
I
P
 
D
L
 
V
L
 
I
T
 
R
G
 
A
A
 
M
G
 
G
-
 
G
-
 
K
-
 
L
-
 
E
-
 
I
-
 
T
-
 
E
-
 
I
-
 
D
-
 
P
-
 
V
-
 
A
-
 
K
-
 
S
A
 
A
D
 
T
I
 
L
T
 
I
I
 
V
E
 
E
N
 
S
S
 
S
R
 
D
I
 
L
I
 
K
G
 
G
G
 
T
E
 
E
T
 
I
I
 
C
G
 
G
D
 
A
I
 
L
L
 
I
V
 
P
R
 
R
S
 
-
T
 
-
R
 
-
T
 
-
L
 
-
K
 
-
P
 
-
L
 
-
V
 
-
I
 
-
S
 
-
N
 
-
P
 
-
T
 
-
V
 
-
V
 
-
A
 
-
G
 
-
V
 
L
I
|
I
D
|
D
E
 
E
L
 
L
P
 
P
M
 
I
L
 
I
S
 
A
V
 
L
L
 
L
S
 
A
A
 
T
F
 
Q
S
 
A
S
 
Q
G
 
G
E
 
V
F
 
T
E
 
V
L
 
I
H
 
K
N
 
D
A
 
A
E
 
E
E
 
E
L
 
L
R
 
K
T
 
V
K
|
K
E
|
E
S
 
T
D
 
D
R
|
R
I
 
I
N
 
Q
A
 
V
I
 
V
V
 
A
V
 
D
N
 
A
L
 
L
E
 
N
R
 
S
L
 
M
G
 
G
F
 
A
D
 
D
C
 
I
E
 
T
Q
 
P
Y
 
T
P
 
A
D
 
D
G
 
G
F
 
M
R
 
I
V
 
I
I
 
K
G
 
G
R
 
K
R
 
S
C
 
A
R
 
L
P
 
H
V
 
G
G
 
A
Q
 
R
V
 
V
T
 
N
V
 
-
A
 
-
C
 
T
F
 
F
D
 
G
D
 
D
H
|
H
R
|
R
I
 
I
A
 
G
M
 
M
S
 
M
F
 
T
A
 
A
V
 
I
A
 
A
A
 
A
R
 
L
A
 
L
T
 
V
G
 
A
E
 
D
G
 
G
-
 
E
I
 
V
A
 
E
L
 
L
S
 
D
D
 
R
S
 
A
D
 
E
V
 
A
V
 
I
G
 
N
V
x
T
S
 
S
F
 
Y
P
 
P
N
 
S
F
 
F
F
 
F
E
 
D
I
 
D
I
 
L
E
 
E
N
 
S
L
 
L

1rf4A Structural studies of streptococcus pneumoniae epsp synthase, tetrahedral intermediate bound state (see paper)
34% identity, 97% coverage: 11:432/434 of query aligns to 16:424/427 of 1rf4A

query
sites
1rf4A
L
 
V
P
 
P
P
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
A
 
S
A
 
I
L
 
I
I
 
F
G
 
G
S
 
S
L
 
L
S
 
A
E
 
E
G
 
G
V
 
E
T
 
T
E
 
K
I
 
V
T
 
Y
N
 
D
F
 
I
S
 
L
A
 
R
G
 
G
F
 
E
D
|
D
N
 
V
Q
 
L
S
 
S
T
 
T
L
 
M
G
 
Q
V
 
V
L
 
F
H
 
R
D
 
D
A
 
L
G
 
G
I
 
V
E
 
E
V
 
I
S
 
E
Q
 
D
H
 
K
E
 
-
I
 
-
D
 
D
G
 
G
A
 
V
Y
 
-
G
 
-
R
 
-
R
 
-
I
 
-
R
 
-
K
 
-
V
 
I
I
 
T
I
 
V
S
 
Q
S
 
G
R
 
V
G
 
G
L
 
M
W
 
A
S
 
G
F
 
L
T
 
K
A
 
A
P
 
P
E
 
Q
K
 
N
P
 
A
L
 
L
M
 
N
C
 
M
N
 
G
N
|
N
S
 
S
G
|
G
S
x
T
T
 
S
M
 
I
R
 
R
M
 
L
F
 
I
A
 
S
G
 
G
I
 
V
L
 
L
A
 
A
A
 
G
Q
 
A
P
 
D
F
 
F
E
 
E
S
 
V
E
 
E
L
 
M
V
 
F
G
 
G
D
 
D
S
x
D
S
 
S
L
 
L
M
 
S
K
 
K
R
|
R
P
 
P
M
 
M
K
 
D
R
 
R
V
 
V
A
 
T
D
 
L
P
 
P
L
 
L
R
 
K
Q
 
K
M
 
M
G
 
G
A
 
V
G
 
S
V
 
I
D
 
S
-
 
G
L
 
Q
S
 
T
P
 
E
A
 
R
G
 
D
T
 
L
A
 
P
P
 
P
V
 
L
R
 
R
I
 
L
R
 
K
G
 
G
T
 
T
R
 
K
D
 
N
L
 
L
T
 
R
P
 
P
L
 
I
E
 
H
Y
 
Y
R
 
E
L
 
L
P
 
P
V
 
I
P
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
L
 
A
V
 
L
T
 
M
F
 
F
A
 
A
A
 
A
L
 
L
H
 
Q
A
 
A
D
 
K
G
 
G
E
 
E
T
 
S
R
 
V
I
 
I
I
 
I
E
 
E
S
 
K
I
 
E
R
 
Y
S
 
T
R
|
R
N
 
N
H
 
H
T
 
T
E
 
E
L
 
D
M
 
M
L
 
L
-
 
Q
-
 
Q
-
 
F
-
 
G
G
 
G
L
 
H
E
 
L
T
 
S
I
 
V
D
 
-
R
 
-
P
 
-
D
 
D
G
 
G
E
 
K
R
 
K
V
 
-
I
 
I
V
 
T
I
 
V
P
 
Q
G
 
G
R
 
P
K
 
Q
T
 
K
I
 
L
V
 
T
A
 
G
R
 
Q
S
 
K
F
 
V
Y
 
V
I
 
V
P
 
P
A
 
G
D
 
D
P
 
I
S
 
S
A
 
S
A
 
A
C
 
A
F
 
F
I
 
W
V
 
L
A
 
V
L
 
A
G
 
G
L
 
L
L
 
I
G
 
A
S
 
P
N
 
N
S
 
S
E
 
R
I
 
L
I
 
V
I
 
L
R
 
Q
D
 
N
V
 
V
C
 
G
L
 
I
N
 
N
P
 
E
T
 
T
R
 
R
V
 
T
E
 
G
F
 
I
I
 
I
P
 
D
L
 
V
L
 
I
T
 
R
G
 
A
A
 
M
G
 
G
-
 
G
-
 
K
-
 
L
-
 
E
-
 
I
-
 
T
-
 
E
-
 
I
-
 
D
-
 
P
-
 
V
-
 
A
-
 
K
-
 
S
A
 
A
D
 
T
I
 
L
T
 
I
I
 
V
E
 
E
N
 
S
S
 
S
R
 
D
I
 
L
I
 
K
G
 
G
G
 
T
E
 
E
T
 
I
I
 
C
G
 
G
D
 
A
I
 
L
L
 
I
V
 
P
R
 
R
S
 
-
T
 
-
R
 
-
T
 
-
L
 
-
K
 
-
P
 
-
L
 
-
V
 
-
I
 
-
S
 
-
N
 
-
P
 
-
T
 
-
V
 
-
V
 
-
A
 
-
G
 
-
V
 
L
I
 
I
D
|
D
E
 
E
L
 
L
P
 
P
M
 
I
L
 
I
S
 
A
V
 
L
L
 
L
S
 
A
A
 
T
F
 
Q
S
 
A
S
 
Q
G
 
G
E
 
V
F
 
T
E
 
V
L
 
I
H
 
K
N
 
D
A
 
A
E
 
E
E
 
E
L
 
L
R
 
K
T
 
V
K
|
K
E
|
E
S
 
T
D
 
D
R
|
R
I
 
I
N
 
Q
A
 
V
I
 
V
V
 
A
V
 
D
N
 
A
L
 
L
E
 
N
R
 
S
L
 
M
G
 
G
F
 
A
D
 
D
C
 
I
E
 
T
Q
 
P
Y
 
T
P
 
A
D
 
D
G
 
G
F
 
M
R
 
I
V
 
I
I
 
K
G
 
G
R
 
K
R
 
S
C
 
A
R
 
L
P
 
H
V
 
G
G
 
A
Q
 
R
V
 
V
T
 
N
V
 
-
A
 
-
C
 
T
F
 
F
D
 
G
D
 
D
H
|
H
R
|
R
I
 
I
A
 
G
M
 
M
S
 
M
F
 
T
A
 
A
V
 
I
A
 
A
A
 
A
R
 
L
A
 
L
T
 
V
G
 
A
E
 
D
G
 
G
-
 
E
I
 
V
A
 
E
L
 
L
S
 
D
D
 
R
S
 
A
D
 
E
V
 
A
V
 
I
G
 
N
V
x
T
S
 
S
F
 
Y
P
 
P
N
 
S
F
 
F
F
 
F
E
 
D
I
 
D
I
 
L
E
 
E
N
 
S
L
 
L

P11043 3-phosphoshikimate 1-carboxyvinyltransferase, chloroplastic; 5-enolpyruvylshikimate-3-phosphate synthase; EPSP synthase; EC 2.5.1.19 from Petunia hybrida (Petunia) (see paper)
27% identity, 97% coverage: 11:431/434 of query aligns to 91:512/516 of P11043

query
sites
P11043
L
 
L
P
 
P
P
 
G
D
 
S
K
 
K
S
 
S
I
 
L
S
 
S
H
 
N
R
 
R
A
 
I
A
 
L
L
 
L
I
 
L
G
 
A
S
 
A
L
 
L
S
 
S
E
 
E
G
 
G
V
 
T
T
 
T
E
 
V
I
 
V
T
 
D
N
 
N
F
 
L
S
 
L
A
 
S
G
 
S
F
 
D
D
 
D
N
 
I
Q
 
H
S
 
Y
T
 
M
L
 
L
G
 
G
V
 
A
L
 
L
H
 
K
D
 
T
A
 
L
G
 
G
I
 
L
E
 
H
V
 
V
S
 
E
Q
 
E
H
 
D
E
 
S
I
 
A
D
 
N
G
 
Q
A
 
-
Y
 
-
G
 
-
R
 
-
R
 
-
I
 
-
R
 
R
K
 
A
V
 
V
I
 
V
I
 
E
S
 
G
S
 
C
R
 
G
G
 
G
L
 
L
W
 
F
S
 
P
F
 
V
-
 
G
-
 
K
-
 
E
T
 
S
A
 
K
P
 
E
E
 
E
K
 
I
P
 
Q
L
 
L
M
 
F
C
 
L
N
 
G
N
 
N
S
 
A
G
|
G
S
 
T
T
 
A
M
 
M
R
 
R
M
 
P
F
 
L
A
 
T
G
 
A
I
 
A
L
 
V
A
 
T
A
 
V
Q
 
A
P
 
G
F
 
G
E
 
N
S
 
S
E
 
R
L
 
Y
V
 
V
G
 
L
D
 
D
S
 
G
-
 
V
-
 
P
S
 
R
L
 
M
M
 
R
K
 
E
R
 
R
P
 
P
M
 
I
K
 
S
R
 
D
V
 
L
A
 
V
D
 
D
P
 
G
L
 
L
R
 
K
Q
 
Q
M
 
L
G
 
G
A
 
A
G
 
E
V
 
V
D
 
D
L
 
C
S
 
F
P
 
-
A
 
L
G
 
G
T
 
T
A
 
K
-
 
C
-
 
P
P
 
P
V
 
V
R
 
R
I
 
I
R
 
V
G
 
S
T
 
K
R
 
G
D
 
G
L
 
L
T
 
P
P
 
G
L
 
G
E
 
K
Y
 
V
R
 
K
L
 
L
P
 
S
V
 
G
P
 
S
-
 
I
S
 
S
A
 
S
Q
 
Q
V
 
Y
K
 
L
S
 
T
L
 
A
V
 
L
T
 
L
F
 
M
A
 
A
A
 
A
L
 
P
H
 
L
A
 
A
D
 
L
G
 
G
-
 
D
-
 
V
E
 
E
T
 
I
R
 
E
I
 
I
I
 
I
E
 
D
S
 
K
I
 
L
R
 
I
S
 
S
R
 
V
N
 
P
H
 
Y
T
 
V
E
 
E
L
 
M
M
 
T
L
 
L
-
 
K
-
 
L
-
 
M
-
 
E
-
 
R
-
 
F
G
 
G
L
 
I
E
 
S
T
 
V
I
 
E
D
 
H
R
 
S
P
 
S
D
 
S
G
 
W
E
 
D
R
 
R
V
 
F
I
 
F
V
 
V
I
 
R
P
 
G
G
 
G
R
 
Q
K
 
K
T
 
Y
I
 
K
V
 
S
A
 
P
R
 
G
S
 
K
F
 
A
Y
 
F
I
 
V
P
 
E
A
 
G
D
 
D
P
 
A
S
 
S
A
 
S
A
 
A
C
 
S
F
 
Y
I
 
F
V
 
L
A
 
A
L
 
-
G
 
G
L
 
A
L
 
A
G
 
V
S
 
T
N
 
G
S
 
G
E
 
T
I
 
I
I
 
T
I
 
V
R
 
E
D
 
G
V
 
C
C
 
G
L
 
T
N
 
N
P
 
S
T
 
L
R
 
Q
-
 
G
-
 
D
V
 
V
E
 
K
F
 
F
I
 
A
P
 
E
L
 
V
L
 
L
T
 
E
G
 
K
A
 
M
G
 
G
A
 
A
D
 
E
I
 
V
T
 
T
-
 
W
I
 
T
E
 
E
N
 
N
S
 
S
R
 
V
I
 
T
I
 
V
G
 
K
G
 
G
E
 
P
T
 
P
I
 
R
G
 
S
D
 
S
I
 
S
L
 
G
V
 
R
R
 
K
S
 
H
T
 
L
R
 
R
T
 
A
L
 
I
K
 
D
P
 
V
L
 
N
V
 
M
I
 
N
S
 
K
N
 
M
P
 
P
T
 
D
V
 
V
V
 
A
A
 
M
G
 
-
V
 
-
I
 
-
D
 
-
E
 
-
L
 
-
P
 
-
M
 
T
L
 
L
S
 
A
V
 
V
L
 
V
S
 
A
A
 
L
F
 
Y
S
 
A
S
 
D
G
 
G
E
 
P
F
 
T
E
 
A
L
 
I
H
 
R
N
 
D
A
 
V
E
 
A
E
 
S
L
 
W
R
 
R
T
 
V
K
 
K
E
 
E
S
 
T
D
 
E
R
 
R
I
 
M
N
 
I
A
 
A
I
 
I
V
 
C
V
 
T
N
 
E
L
 
L
E
 
R
R
 
K
L
 
L
G
 
G
F
 
A
D
 
T
C
 
V
E
 
E
Q
 
E
Y
 
G
P
 
P
D
 
D
G
 
-
F
 
-
R
 
Y
V
 
C
I
 
I
G
 
I
R
 
T
R
 
P
C
 
P
R
 
E
P
 
K
V
 
L
G
 
N
Q
 
V
V
 
T
T
 
D
V
 
I
A
 
D
C
 
T
F
 
Y
D
 
D
D
 
D
H
 
H
R
 
R
I
 
M
A
 
A
M
 
M
S
 
A
F
 
F
A
 
S
V
 
L
A
 
A
A
 
A
R
 
C
A
 
A
T
 
D
G
 
V
E
 
P
G
 
-
I
 
V
A
 
T
L
 
I
S
 
N
D
 
D
S
 
P
D
 
G
V
 
C
V
 
T
G
 
R
V
 
K
S
 
T
F
 
F
P
 
P
N
 
N
F
 
Y
F
 
F
E
 
D
I
 
V
I
 
L
E
 
Q
N
 
Q

7tm6A Crystal structure of shikimate-3-phosphate and glyphosate bound 3- phosphoshikimate 1-carboxyvinyltransferase from klebsiella pneumoniae
25% identity, 96% coverage: 11:427/434 of query aligns to 17:417/426 of 7tm6A

query
sites
7tm6A
L
 
L
P
 
P
P
 
G
D
 
S
K
|
K
S
|
S
I
 
V
S
 
S
H
 
N
R
|
R
A
 
A
A
 
L
L
 
L
I
 
L
G
 
A
S
 
A
L
 
L
S
 
A
E
 
R
G
 
G
V
 
T
T
 
T
E
 
V
I
 
L
T
 
T
N
 
N
F
 
L
S
 
L
A
 
D
G
 
S
F
 
D
D
 
D
N
 
V
Q
 
R
S
 
H
T
 
M
L
 
L
G
 
N
V
 
A
L
 
L
H
 
S
D
 
A
A
 
L
G
 
G
I
 
V
E
 
Q
V
 
Y
S
 
T
Q
 
L
H
 
S
E
 
-
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
-
G
 
A
R
 
D
R
 
R
I
 
T
R
 
R
K
 
C
V
 
E
I
 
V
I
 
T
S
 
G
S
 
N
R
 
G
G
 
G
-
 
P
L
 
L
W
 
R
S
 
S
F
 
A
T
 
A
A
 
A
P
 
L
E
 
E
K
 
-
P
 
-
L
 
L
M
 
F
C
 
L
N
 
G
N
 
N
S
 
A
G
|
G
S
x
T
T
 
A
M
 
M
R
 
R
M
 
P
F
 
L
A
 
A
G
 
A
I
 
A
L
 
L
A
 
C
A
 
L
Q
 
G
P
 
S
F
 
N
E
 
D
S
 
I
E
 
V
L
 
L
V
 
T
G
 
G
D
 
E
S
 
P
S
 
R
L
 
M
M
 
K
K
 
E
R
|
R
P
 
P
M
 
I
K
 
G
R
 
H
V
 
L
A
 
V
D
 
D
P
 
A
L
 
L
R
 
R
Q
 
Q
M
 
G
G
 
G
A
 
A
G
 
Q
V
 
I
D
 
D
-
 
C
L
 
L
S
 
E
P
 
Q
A
 
E
G
 
N
T
 
Y
A
 
P
P
 
P
V
 
L
R
 
R
I
 
L
R
 
R
G
 
G
T
 
G
R
 
F
D
 
Q
L
 
G
T
 
G
P
 
N
L
 
V
E
 
E
Y
 
V
R
 
D
L
 
G
P
 
S
V
 
V
P
x
S
S
|
S
A
x
Q
Q
 
F
V
 
L
K
 
T
S
 
A
L
 
L
V
 
L
T
 
M
F
 
T
A
 
A
A
 
P
L
 
L
H
 
A
A
 
P
D
 
Q
G
 
D
E
 
T
T
 
V
R
 
I
I
 
V
I
 
I
E
 
K
-
 
G
S
 
D
I
 
L
R
 
V
S
|
S
R
 
K
N
 
P
H
x
Y
T
 
I
E
 
D
L
 
I
M
 
T
L
 
L
G
 
H
L
 
L
E
 
M
T
 
K
-
 
T
-
 
F
-
 
G
-
 
V
-
 
E
I
 
V
D
 
D
R
 
N
P
 
Q
D
 
S
G
 
Y
E
 
Q
R
 
R
V
 
F
I
 
V
V
 
V
I
 
R
P
 
G
G
 
K
R
 
Q
K
 
Q
T
 
Y
I
 
Q
V
 
S
A
 
P
R
 
G
S
 
D
F
 
Y
Y
 
L
I
 
V
P
 
E
A
 
G
D
 
D
P
 
A
S
 
S
A
 
S
A
 
A
C
 
S
F
 
Y
I
 
F
V
 
L
A
 
A
L
 
A
G
 
G
L
 
A
L
 
I
G
 
K
S
 
G
N
 
G
S
 
T
E
 
-
I
 
V
I
 
K
I
 
V
R
 
T
D
 
G
V
 
I
C
 
G
L
 
R
N
 
N
P
 
S
T
 
V
R
 
Q
-
 
G
-
 
D
V
 
I
E
 
R
F
 
F
I
 
A
P
 
D
L
 
V
L
 
L
T
 
E
G
 
K
A
 
M
G
 
G
A
 
A
D
 
T
I
 
V
T
 
-
I
 
-
E
 
-
N
 
-
S
 
-
R
 
-
I
 
-
I
 
-
G
 
-
G
 
-
E
 
-
T
 
T
I
 
W
G
 
G
D
 
D
I
 
D
L
 
F
V
 
I
R
 
A
S
 
C
T
 
T
R
 
H
-
 
G
T
 
E
L
 
L
K
 
K
P
 
A
L
 
V
V
 
D
I
 
M
S
 
D
N
 
-
P
 
-
T
 
-
V
 
-
V
 
M
A
 
N
G
 
H
V
 
I
I
 
P
D
|
D
E
 
A
L
 
A
P
 
M
M
 
T
L
 
I
S
 
A
V
 
T
L
 
A
S
 
A
A
 
L
F
 
F
S
 
A
S
 
Q
G
 
G
E
 
T
F
 
T
E
 
T
L
 
L
H
 
R
N
 
N
A
 
I
E
 
Y
E
x
N
L
 
W
R
 
R
T
 
V
K
|
K
E
|
E
S
 
T
D
 
D
R
|
R
I
 
L
N
 
F
A
 
A
I
 
M
V
 
A
V
 
T
N
 
E
L
 
L
E
 
R
R
 
K
L
 
V
G
 
G
F
 
A
D
 
E
C
 
V
E
 
E
Q
 
E
Y
 
G
P
 
E
D
 
D
G
 
Y
F
 
I
R
 
R
V
 
I
I
 
T
G
 
-
R
 
-
R
 
-
C
 
-
R
 
-
P
 
P
V
 
P
G
 
A
Q
 
K
V
 
L
T
 
K
V
 
Y
A
 
A
-
 
E
-
 
I
-
 
G
C
 
T
F
 
Y
D
 
N
D
 
D
H
|
H
R
|
R
I
 
M
A
 
A
M
 
M
S
 
C
F
 
F
A
 
S
V
 
L
A
 
V
A
 
A
R
 
-
A
 
L
T
 
S
G
 
D
E
 
T
G
 
P
I
 
V
A
 
T
L
 
I
S
 
L
D
 
D
S
 
P
D
 
K
V
 
C
V
 
T
G
 
A
V
 
K
S
 
T
F
 
F
P
 
P
N
 
D
F
 
Y
F
 
F
E
 
E

3nvsA 1.02 angstrom resolution crystal structure of 3-phosphoshikimate 1- carboxyvinyltransferase from vibrio cholerae in complex with shikimate-3-phosphate (partially photolyzed) and glyphosate
24% identity, 99% coverage: 3:432/434 of query aligns to 11:424/426 of 3nvsA

query
sites
3nvsA
V
 
L
F
 
I
K
 
S
G
 
G
E
 
E
V
 
V
T
 
N
A
 
-
L
 
L
P
 
P
P
 
G
D
 
S
K
|
K
S
|
S
I
 
V
S
 
S
H
 
N
R
|
R
A
 
A
A
 
L
L
 
L
I
 
L
G
 
A
S
 
A
L
 
L
S
 
A
E
 
S
G
 
G
V
 
T
T
 
T
E
 
R
I
 
L
T
 
T
N
 
N
F
 
L
S
 
L
A
 
D
G
 
S
F
 
D
D
|
D
N
 
I
Q
 
R
S
 
H
T
 
M
L
 
L
G
 
N
V
 
A
L
 
L
H
 
T
D
 
K
A
 
L
G
 
G
I
 
V
E
 
N
V
 
-
S
 
-
Q
 
-
H
 
-
E
 
-
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
Y
G
 
R
R
 
L
R
 
S
I
 
A
R
 
D
K
 
K
V
 
T
I
 
T
I
 
C
S
 
E
S
 
V
R
 
E
G
 
G
L
 
L
W
 
G
S
 
Q
F
 
A
T
 
F
A
 
H
P
 
T
E
 
T
K
 
Q
P
 
P
-
 
L
-
 
E
L
 
L
M
 
F
C
 
L
N
 
G
N
|
N
S
 
A
G
|
G
S
x
T
T
 
A
M
 
M
R
 
R
M
 
P
F
 
L
A
 
A
G
 
A
I
 
A
L
 
L
A
 
C
A
 
L
Q
 
G
P
 
Q
F
 
G
E
 
D
S
 
Y
E
 
V
L
 
L
V
 
T
G
 
G
D
 
E
S
x
P
S
 
R
L
 
M
M
 
K
K
x
E
R
|
R
P
 
P
M
 
I
K
 
G
R
x
H
V
 
L
A
 
V
D
 
D
P
 
A
L
 
L
R
 
R
Q
|
Q
M
 
A
G
 
G
A
 
A
G
 
Q
V
 
I
D
 
E
-
x
Y
L
 
L
S
x
E
P
x
Q
A
 
E
G
 
N
T
 
F
A
 
P
P
 
P
V
 
L
R
 
R
I
 
I
R
 
Q
G
 
G
T
 
T
R
 
G
D
 
L
L
 
Q
T
 
A
P
 
G
L
 
T
E
 
V
Y
 
T
R
 
I
L
 
D
P
 
G
V
 
S
P
 
I
S
|
S
A
x
S
Q
|
Q
V
 
F
K
 
L
S
 
T
L
 
A
V
 
F
T
 
L
F
 
M
A
 
S
A
 
A
L
 
P
H
 
L
A
 
A
D
 
Q
G
 
G
E
 
K
T
 
V
-
 
T
-
 
I
R
 
K
I
 
I
I
 
V
E
 
G
S
 
E
I
 
L
R
 
V
S
|
S
R
 
K
N
 
P
H
x
Y
T
 
I
E
 
D
L
 
I
M
 
T
L
 
L
-
 
H
-
 
I
-
 
M
-
 
E
-
 
Q
-
 
F
G
 
G
L
 
V
E
 
Q
T
 
V
I
 
I
D
 
N
R
 
H
P
 
-
D
 
D
G
 
Y
E
 
Q
R
 
E
V
 
F
I
 
V
V
 
I
I
 
P
P
 
A
G
 
G
R
 
Q
K
 
S
T
 
Y
I
 
V
V
 
S
A
 
P
R
 
G
S
 
Q
F
 
F
Y
 
L
I
 
V
P
 
E
A
 
G
D
 
D
P
 
A
S
 
S
A
 
S
A
|
A
C
 
S
F
 
Y
I
 
F
V
 
L
A
 
A
L
 
A
G
 
A
L
x
A
L
 
I
G
 
-
S
 
K
N
 
G
S
 
G
E
 
E
I
 
V
I
 
K
I
 
V
R
 
T
D
 
G
V
 
I
C
 
G
L
 
K
N
 
N
P
 
S
T
 
I
R
 
Q
-
 
G
-
 
D
V
 
I
E
 
Q
F
 
F
I
 
A
P
 
D
L
 
A
L
 
L
T
 
E
G
 
K
A
 
M
G
 
G
A
 
A
D
 
Q
I
 
I
T
 
E
I
 
W
E
 
G
N
 
D
S
 
D
R
 
Y
I
 
V
I
 
I
G
 
A
G
 
-
E
 
-
T
 
-
I
 
-
G
 
-
D
 
-
I
 
-
L
 
-
V
 
R
R
 
R
S
 
G
T
 
E
R
 
L
T
 
N
L
 
A
K
 
V
P
 
D
L
 
L
V
 
D
I
 
F
S
 
N
N
 
H
P
 
-
T
 
-
V
 
-
V
 
-
A
 
-
G
 
-
V
 
I
I
 
P
D
|
D
E
 
A
L
 
A
P
 
M
M
 
T
L
 
I
S
 
A
V
 
T
L
 
T
S
 
A
A
 
L
F
 
F
S
 
A
S
 
K
G
 
G
E
 
T
F
 
T
E
 
A
L
 
I
H
 
R
N
 
N
A
 
V
E
 
Y
E
x
N
L
 
W
R
 
R
T
 
V
K
|
K
E
|
E
S
 
T
D
 
D
R
|
R
I
 
L
N
 
A
A
 
A
I
 
M
V
 
A
V
 
T
N
 
E
L
 
L
E
 
R
R
 
K
L
 
V
G
 
G
F
 
A
D
 
T
C
 
V
E
 
E
Q
 
E
Y
 
G
P
 
E
D
 
D
G
 
-
F
 
F
R
 
I
V
 
V
I
 
I
G
 
T
R
 
P
R
 
P
C
 
T
R
 
K
P
 
L
V
 
I
G
 
-
Q
 
H
V
 
A
T
 
A
V
 
I
A
 
D
C
 
T
F
 
Y
D
 
D
D
 
D
H
|
H
R
|
R
I
 
M
A
 
A
M
 
M
S
 
C
F
 
F
A
 
S
V
 
L
A
 
V
A
 
A
R
 
-
A
 
L
T
 
S
G
 
D
E
 
T
G
 
P
I
 
V
A
 
T
L
 
I
S
 
N
D
 
D
S
 
P
D
 
K
V
 
C
V
 
T
G
 
S
V
x
K
S
 
T
F
 
F
P
 
P
N
 
D
F
 
Y
F
 
F
E
 
D
I
 
K
I
 
F
E
 
A
N
 
Q
L
 
L

Q9KRB0 3-phosphoshikimate 1-carboxyvinyltransferase; 5-enolpyruvylshikimate-3-phosphate synthase; EPSP synthase; EPSPS; EC 2.5.1.19 from Vibrio cholerae serotype O1 (strain ATCC 39315 / El Tor Inaba N16961)
24% identity, 99% coverage: 3:432/434 of query aligns to 11:424/426 of Q9KRB0

query
sites
Q9KRB0
V
 
L
F
 
I
K
 
S
G
 
G
E
 
E
V
 
V
T
 
N
A
 
-
L
 
L
P
 
P
P
 
G
D
 
S
K
|
K
S
|
S
I
 
V
S
 
S
H
 
N
R
|
R
A
 
A
A
 
L
L
 
L
I
 
L
G
 
A
S
 
A
L
 
L
S
 
A
E
 
S
G
 
G
V
 
T
T
 
T
E
 
R
I
 
L
T
 
T
N
 
N
F
 
L
S
 
L
A
 
D
G
 
S
F
 
D
D
 
D
N
 
I
Q
 
R
S
 
H
T
 
M
L
 
L
G
 
N
V
 
A
L
 
L
H
 
T
D
 
K
A
 
L
G
 
G
I
 
V
E
 
N
V
 
-
S
 
-
Q
 
-
H
 
-
E
 
-
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
Y
G
 
R
R
 
L
R
 
S
I
 
A
R
 
D
K
 
K
V
 
T
I
 
T
I
 
C
S
 
E
S
 
V
R
 
E
G
 
G
L
 
L
W
 
G
S
 
Q
F
 
A
T
 
F
A
 
H
P
 
T
E
 
T
K
 
Q
P
 
P
-
 
L
-
 
E
L
 
L
M
 
F
C
 
L
N
 
G
N
 
N
S
 
A
G
 
G
S
 
T
T
 
A
M
 
M
R
 
R
M
 
P
F
 
L
A
 
A
G
 
A
I
 
A
L
 
L
A
 
C
A
 
L
Q
 
G
P
 
Q
F
 
G
E
 
D
S
 
Y
E
 
V
L
 
L
V
 
T
G
 
G
D
 
E
S
 
P
S
 
R
L
 
M
M
 
K
K
 
E
R
 
R
P
 
P
M
 
I
K
 
G
R
 
H
V
 
L
A
 
V
D
 
D
P
 
A
L
 
L
R
 
R
Q
 
Q
M
 
A
G
 
G
A
 
A
G
 
Q
V
 
I
D
 
E
-
 
Y
L
 
L
S
 
E
P
 
Q
A
 
E
G
 
N
T
 
F
A
 
P
P
 
P
V
 
L
R
 
R
I
 
I
R
 
Q
G
 
G
T
 
T
R
 
G
D
 
L
L
 
Q
T
 
A
P
 
G
L
 
T
E
 
V
Y
 
T
R
 
I
L
 
D
P
 
G
V
 
S
P
 
I
S
|
S
A
x
S
Q
 
Q
V
 
F
K
 
L
S
 
T
L
 
A
V
 
F
T
 
L
F
 
M
A
 
S
A
 
A
L
 
P
H
 
L
A
 
A
D
 
Q
G
 
G
E
 
K
T
 
V
-
 
T
-
 
I
R
 
K
I
 
I
I
 
V
E
 
G
S
 
E
I
 
L
R
 
V
S
|
S
R
 
K
N
 
P
H
 
Y
T
 
I
E
 
D
L
 
I
M
 
T
L
 
L
-
 
H
-
 
I
-
 
M
-
 
E
-
 
Q
-
 
F
G
 
G
L
 
V
E
 
Q
T
 
V
I
 
I
D
 
N
R
 
H
P
 
-
D
 
D
G
 
Y
E
 
Q
R
 
E
V
 
F
I
 
V
V
 
I
I
 
P
P
 
A
G
 
G
R
 
Q
K
 
S
T
 
Y
I
 
V
V
 
S
A
 
P
R
 
G
S
 
Q
F
 
F
Y
 
L
I
 
V
P
 
E
A
 
G
D
 
D
P
 
A
S
 
S
A
 
S
A
 
A
C
 
S
F
 
Y
I
 
F
V
 
L
A
 
A
L
 
A
G
 
A
L
 
A
L
 
I
G
 
-
S
 
K
N
 
G
S
 
G
E
 
E
I
 
V
I
 
K
I
 
V
R
 
T
D
 
G
V
 
I
C
 
G
L
 
K
N
 
N
P
 
S
T
 
I
R
 
Q
-
 
G
-
 
D
V
 
I
E
 
Q
F
 
F
I
 
A
P
 
D
L
 
A
L
 
L
T
 
E
G
 
K
A
 
M
G
 
G
A
 
A
D
 
Q
I
 
I
T
 
E
I
 
W
E
 
G
N
 
D
S
 
D
R
 
Y
I
 
V
I
 
I
G
 
A
G
 
-
E
 
-
T
 
-
I
 
-
G
 
-
D
 
-
I
 
-
L
 
-
V
 
R
R
 
R
S
 
G
T
 
E
R
 
L
T
 
N
L
 
A
K
 
V
P
 
D
L
 
L
V
 
D
I
 
F
S
 
N
N
 
H
P
 
-
T
 
-
V
 
-
V
 
-
A
 
-
G
 
-
V
 
I
I
 
P
D
|
D
E
 
A
L
 
A
P
 
M
M
 
T
L
 
I
S
 
A
V
 
T
L
 
T
S
 
A
A
 
L
F
 
F
S
 
A
S
 
K
G
 
G
E
 
T
F
 
T
E
 
A
L
 
I
H
 
R
N
 
N
A
 
V
E
 
Y
E
x
N
L
 
W
R
 
R
T
 
V
K
|
K
E
 
E
S
 
T
D
 
D
R
 
R
I
 
L
N
 
A
A
 
A
I
 
M
V
 
A
V
 
T
N
 
E
L
 
L
E
 
R
R
 
K
L
 
V
G
 
G
F
 
A
D
 
T
C
 
V
E
 
E
Q
 
E
Y
 
G
P
 
E
D
 
D
G
 
-
F
 
F
R
 
I
V
 
V
I
 
I
G
 
T
R
 
P
R
 
P
C
 
T
R
 
K
P
 
L
V
 
I
G
 
-
Q
 
H
V
 
A
T
 
A
V
 
I
A
 
D
C
 
T
F
 
Y
D
 
D
D
 
D
H
 
H
R
 
R
I
 
M
A
 
A
M
 
M
S
 
C
F
 
F
A
 
S
V
 
L
A
 
V
A
 
A
R
 
-
A
 
L
T
 
S
G
 
D
E
 
T
G
 
P
I
 
V
A
 
T
L
 
I
S
 
N
D
 
D
S
 
P
D
 
K
V
 
C
V
 
T
G
 
S
V
 
K
S
 
T
F
 
F
P
 
P
N
 
D
F
 
Y
F
 
F
E
 
D
I
 
K
I
 
F
E
 
A
N
 
Q
L
 
L

7tm5B Crystal structure of shikimate-3-phosphate bound 3-phosphoshikimate 1- carboxyvinyltransferase from klebsiella pneumoniae
25% identity, 96% coverage: 11:427/434 of query aligns to 18:418/427 of 7tm5B

query
sites
7tm5B
L
 
L
P
 
P
P
 
G
D
 
S
K
|
K
S
|
S
I
 
V
S
 
S
H
 
N
R
|
R
A
 
A
A
 
L
L
 
L
I
 
L
G
 
A
S
 
A
L
 
L
S
 
A
E
 
R
G
 
G
V
 
T
T
 
T
E
 
V
I
 
L
T
 
T
N
 
N
F
 
L
S
 
L
A
 
D
G
 
S
F
 
D
D
 
D
N
 
V
Q
 
R
S
 
H
T
 
M
L
 
L
G
 
N
V
 
A
L
 
L
H
 
S
D
 
A
A
 
L
G
 
G
I
 
V
E
 
Q
V
 
Y
S
 
T
Q
 
L
H
 
S
E
 
-
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
-
G
 
A
R
 
D
R
 
R
I
 
T
R
 
R
K
 
C
V
 
E
I
 
V
I
 
T
S
 
G
S
 
N
R
 
G
G
 
G
-
 
P
L
 
L
W
 
R
S
 
S
F
 
A
T
 
A
A
 
A
P
 
L
E
 
E
K
 
-
P
 
-
L
 
L
M
 
F
C
 
L
N
 
G
N
 
N
S
 
A
G
 
G
S
 
T
T
 
A
M
 
M
R
 
R
M
 
P
F
 
L
A
 
A
G
 
A
I
 
A
L
 
L
A
 
C
A
 
L
Q
 
G
P
 
S
F
 
N
E
 
D
S
 
I
E
 
V
L
 
L
V
 
T
G
 
G
D
 
E
S
 
P
S
 
R
L
 
M
M
 
K
K
 
E
R
 
R
P
 
P
M
 
I
K
 
G
R
 
H
V
 
L
A
 
V
D
 
D
P
 
A
L
 
L
R
 
R
Q
 
Q
M
 
G
G
 
G
A
 
A
G
 
Q
V
 
I
D
 
D
-
 
C
L
 
L
S
 
E
P
 
Q
A
 
E
G
 
N
T
 
Y
A
 
P
P
 
P
V
 
L
R
 
R
I
 
L
R
 
R
G
 
G
T
 
G
R
 
F
D
 
Q
L
 
G
T
 
G
P
 
N
L
 
V
E
 
E
Y
 
V
R
 
D
L
 
G
P
 
S
V
 
V
P
x
S
S
|
S
A
x
Q
Q
 
F
V
 
L
K
 
T
S
 
A
L
 
L
V
 
L
T
 
M
F
 
T
A
 
A
A
 
P
L
 
L
H
 
A
A
 
P
D
 
Q
G
 
D
E
 
T
T
 
V
R
 
I
I
 
V
I
 
I
E
 
K
-
 
G
S
 
D
I
 
L
R
 
V
S
|
S
R
 
K
N
 
P
H
x
Y
T
 
I
E
 
D
L
 
I
M
 
T
L
 
L
G
 
H
L
 
L
E
 
M
T
 
K
-
 
T
-
 
F
-
 
G
-
 
V
-
 
E
I
 
V
D
 
D
R
 
N
P
 
Q
D
 
S
G
 
Y
E
 
Q
R
 
R
V
 
F
I
 
V
V
 
V
I
 
R
P
 
G
G
 
K
R
 
Q
K
 
Q
T
 
Y
I
 
Q
V
 
S
A
 
P
R
 
G
S
 
D
F
 
Y
Y
 
L
I
 
V
P
 
E
A
 
G
D
 
D
P
 
A
S
 
S
A
 
S
A
 
A
C
 
S
F
 
Y
I
 
F
V
 
L
A
 
A
L
 
A
G
 
G
L
 
A
L
 
I
G
 
K
S
 
G
N
 
G
S
 
T
E
 
-
I
 
V
I
 
K
I
 
V
R
 
T
D
 
G
V
 
I
C
 
G
L
 
R
N
 
N
P
 
S
T
 
V
R
 
Q
-
 
G
-
 
D
V
 
I
E
 
R
F
 
F
I
 
A
P
 
D
L
 
V
L
 
L
T
 
E
G
 
K
A
 
M
G
 
G
A
 
A
D
 
T
I
 
V
T
 
-
I
 
-
E
 
-
N
 
-
S
 
-
R
 
-
I
 
-
I
 
-
G
 
-
G
 
-
E
 
-
T
 
T
I
 
W
G
 
G
D
 
D
I
 
D
L
 
F
V
 
I
R
 
A
S
 
C
T
 
T
R
 
H
-
 
G
T
 
E
L
 
L
K
 
K
P
 
A
L
 
V
V
 
D
I
 
M
S
 
D
N
 
-
P
 
-
T
 
-
V
 
-
V
 
M
A
 
N
G
 
H
V
 
I
I
 
P
D
|
D
E
 
A
L
 
A
P
 
M
M
 
T
L
 
I
S
 
A
V
 
T
L
 
A
S
 
A
A
 
L
F
 
F
S
 
A
S
 
Q
G
 
G
E
 
T
F
 
T
E
 
T
L
 
L
H
 
R
N
 
N
A
 
I
E
 
Y
E
x
N
L
 
W
R
 
R
T
 
V
K
|
K
E
 
E
S
 
T
D
 
D
R
 
R
I
 
L
N
 
F
A
 
A
I
 
M
V
 
A
V
 
T
N
 
E
L
 
L
E
 
R
R
 
K
L
 
V
G
 
G
F
 
A
D
 
E
C
 
V
E
 
E
Q
 
E
Y
 
G
P
 
E
D
 
D
G
 
Y
F
 
I
R
 
R
V
 
I
I
 
T
G
 
-
R
 
-
R
 
-
C
 
-
R
 
-
P
 
P
V
 
P
G
 
A
Q
 
K
V
 
L
T
 
K
V
 
Y
A
 
A
-
 
E
-
 
I
-
 
G
C
 
T
F
 
Y
D
 
N
D
 
D
H
 
H
R
 
R
I
 
M
A
 
A
M
 
M
S
 
C
F
 
F
A
 
S
V
 
L
A
 
V
A
 
A
R
 
-
A
 
L
T
 
S
G
 
D
E
 
T
G
 
P
I
 
V
A
 
T
L
 
I
S
 
L
D
 
D
S
 
P
D
 
K
V
 
C
V
 
T
G
 
A
V
 
K
S
 
T
F
 
F
P
 
P
N
 
D
F
 
Y
F
 
F
E
 
E

P07547 Pentafunctional AROM polypeptide; EC 4.2.3.4; EC 2.5.1.19; EC 2.7.1.71; EC 4.2.1.10; EC 1.1.1.25 from Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) (Aspergillus nidulans) (see 2 papers)
24% identity, 98% coverage: 8:432/434 of query aligns to 408:839/1583 of P07547

query
sites
P07547
V
 
I
T
 
C
A
 
A
L
 
P
P
 
P
P
 
G
D
 
S
K
 
K
S
 
S
I
 
I
S
 
S
H
 
N
R
 
R
A
 
A
A
 
L
L
 
V
I
 
L
G
 
A
S
 
A
L
 
L
S
 
G
E
 
S
G
 
G
V
 
T
T
 
C
E
 
R
I
 
I
T
 
K
N
 
N
F
 
L
S
 
L
A
 
H
G
 
S
F
 
D
D
 
D
N
 
T
Q
 
E
S
 
V
T
 
M
L
 
L
G
 
N
V
 
A
L
 
L
H
 
E
D
 
R
A
 
L
G
 
G
I
 
A
E
 
A
V
 
T
S
 
F
Q
 
S
H
 
W
E
 
E
I
 
E
D
 
E
G
 
G
A
 
E
Y
 
V
G
 
-
R
 
-
R
 
-
I
 
-
R
 
-
K
 
-
V
 
L
I
 
V
I
 
V
S
 
N
S
 
G
R
 
K
G
 
G
L
 
-
W
 
G
S
 
N
F
 
L
T
 
Q
A
 
A
P
 
S
E
 
S
K
 
S
P
 
P
L
 
L
M
 
Y
C
 
L
N
 
G
N
 
N
S
 
A
G
 
G
S
 
T
T
 
A
M
 
S
R
 
R
M
 
F
F
 
L
A
 
T
G
 
T
I
 
V
L
 
A
-
 
T
-
 
L
-
 
A
-
 
N
A
 
S
A
 
S
Q
 
T
P
 
V
F
 
D
E
 
S
S
 
S
E
 
V
L
 
L
V
 
T
G
 
G
D
 
N
S
 
N
S
 
R
L
 
M
M
 
K
K
 
Q
R
 
R
P
 
P
M
 
I
K
 
G
R
 
D
V
 
L
A
 
V
D
 
D
P
 
A
L
 
L
R
 
T
Q
 
A
M
 
N
G
 
G
A
 
A
G
 
S
V
 
I
D
 
E
-
 
Y
L
 
V
S
 
E
P
 
R
A
 
T
G
 
G
T
 
S
A
 
L
P
 
P
V
 
L
R
 
K
I
 
I
R
 
A
G
 
A
T
 
S
R
 
G
D
 
G
L
 
F
T
 
A
P
 
G
L
 
G
E
 
N
Y
 
I
R
 
N
L
 
L
-
 
A
-
 
A
P
 
K
V
 
V
P
 
S
S
 
S
A
 
Q
Q
 
Y
V
 
V
K
 
S
S
 
S
L
 
L
V
 
L
T
 
M
F
 
C
A
 
A
A
 
P
L
 
Y
H
 
A
A
 
K
D
 
E
G
 
P
E
 
V
T
 
T
-
 
L
-
 
R
-
 
L
-
 
V
-
 
G
-
 
G
R
 
K
I
 
P
I
 
I
E
 
S
S
 
Q
I
 
P
R
 
Y
S
 
I
R
 
D
N
 
M
H
 
T
T
 
T
E
 
A
L
 
M
M
 
M
-
 
R
-
 
S
L
 
F
G
 
G
L
 
I
E
 
D
T
 
V
I
 
Q
D
 
K
R
 
S
P
 
T
D
 
T
G
 
E
E
 
E
R
 
H
V
 
T
I
 
Y
V
 
H
I
 
I
P
 
P
G
 
Q
R
 
G
K
 
R
T
 
Y
I
 
V
V
 
N
A
 
P
R
 
A
S
 
E
F
 
Y
Y
 
V
I
 
I
P
 
E
A
 
S
D
 
D
P
 
A
S
 
S
A
 
S
A
 
A
C
 
T
F
 
Y
I
 
P
V
 
L
A
 
A
L
 
V
G
 
A
L
 
A
L
 
V
G
 
T
S
 
G
N
 
T
S
 
T
E
 
C
I
 
T
I
 
V
-
 
P
-
 
N
I
 
I
R
 
G
D
 
S
V
 
A
C
 
S
L
 
L
N
 
Q
P
 
G
T
 
D
R
 
A
V
 
R
E
 
F
F
 
A
I
 
V
P
 
E
L
 
V
L
 
L
T
 
R
G
 
P
A
 
M
G
 
G
A
 
C
D
 
T
I
 
V
-
 
E
T
 
Q
I
 
T
E
 
E
N
 
T
S
 
S
R
 
T
I
 
T
I
 
V
G
 
T
G
 
G
E
 
P
T
 
S
I
 
D
G
 
G
D
 
-
I
 
-
L
 
-
V
 
-
R
 
-
S
 
-
T
 
-
R
 
-
T
 
I
L
 
L
K
 
R
P
 
P
L
 
L
V
 
-
I
 
-
S
 
-
N
 
-
P
 
P
T
 
N
V
 
V
-
 
D
V
 
M
A
 
E
G
 
P
V
 
M
I
 
T
D
 
D
E
 
A
L
 
F
P
 
L
M
 
G
L
 
A
S
 
S
V
 
V
L
 
L
S
 
A
A
 
A
F
 
I
S
 
A
S
 
R
G
 
G
E
 
K
F
 
E
E
 
S
L
 
N
H
 
H
N
 
T
A
 
T
E
 
R
-
 
I
-
 
Y
-
 
G
-
 
I
-
 
A
E
 
N
L
 
Q
R
 
R
T
 
V
K
 
K
E
 
E
S
 
C
D
 
N
R
 
R
I
 
I
N
 
K
A
 
A
I
 
M
V
 
K
V
 
D
N
 
E
L
 
L
E
 
A
R
 
K
L
 
F
G
 
G
F
 
V
D
 
I
C
 
C
E
 
R
Q
 
E
Y
 
H
P
 
D
D
 
D
G
 
G
F
 
L
R
 
E
V
 
I
I
 
D
G
 
G
-
 
I
-
 
D
-
 
R
-
 
S
R
 
N
R
 
L
C
 
R
R
 
Q
P
 
P
V
 
V
G
 
G
Q
 
G
V
 
V
T
 
F
V
 
-
A
 
-
C
 
C
F
 
Y
D
 
D
D
 
D
H
 
H
R
 
R
I
 
V
A
 
A
M
 
F
S
 
S
F
 
F
A
 
S
V
 
V
A
 
L
A
 
S
R
 
L
A
 
V
T
 
T
G
 
P
E
 
Q
G
 
P
I
 
T
A
 
L
L
 
I
S
 
L
D
 
E
S
 
K
D
 
E
V
 
C
V
 
V
G
 
G
V
 
K
S
 
T
F
 
W
P
 
P
N
 
G
F
 
W
F
 
W
E
 
D
I
 
T
I
 
L
E
 
R
N
 
Q
L
 
L

Sites not aligning to the query:

6hqvA Pentafunctional arom complex from chaetomium thermophilum (see paper)
24% identity, 98% coverage: 8:432/434 of query aligns to 400:827/1555 of 6hqvA

query
sites
6hqvA
V
 
V
T
 
T
A
 
V
L
 
T
P
 
P
P
 
P
-
 
G
D
 
S
K
 
K
S
 
S
I
 
I
S
 
S
H
 
N
R
|
R
A
 
A
A
 
L
L
 
V
I
 
L
G
 
A
S
 
A
L
 
L
S
 
G
E
 
E
G
 
G
V
 
T
T
 
T
E
 
R
I
 
I
T
 
H
N
 
G
F
 
L
S
 
L
A
 
H
G
 
S
F
 
D
D
 
D
N
 
V
Q
 
Q
S
 
Y
T
 
M
L
 
L
G
 
-
V
 
-
L
 
-
H
 
-
D
 
-
A
 
A
G
 
A
I
 
I
E
 
E
V
 
-
S
 
Q
Q
 
L
H
 
H
E
 
G
I
 
A
D
 
D
G
 
F
A
 
S
Y
 
W
G
 
E
R
 
D
R
 
A
I
 
G
R
 
E
K
 
I
V
 
L
I
 
V
I
 
V
S
 
T
S
 
G
R
 
K
G
 
G
L
 
-
W
 
G
S
 
K
F
 
L
T
 
Q
A
 
A
P
 
S
E
 
K
K
 
E
P
 
P
L
 
L
M
 
Y
C
 
L
N
 
G
N
 
N
S
 
A
G
 
G
S
 
T
T
 
A
M
 
S
R
 
R
M
 
F
F
 
L
A
 
T
G
 
S
I
 
V
L
 
V
A
 
A
-
 
L
-
 
C
-
 
A
-
 
P
A
 
S
Q
 
A
P
 
V
F
 
S
E
 
S
S
 
T
E
 
V
L
 
L
V
 
T
G
 
G
D
 
N
S
 
A
S
 
R
L
 
M
M
 
K
K
 
V
R
 
R
P
 
P
M
 
I
K
 
G
R
 
A
V
 
L
A
 
V
D
 
D
P
 
A
L
 
L
R
 
R
Q
 
A
M
 
N
G
 
G
A
 
V
G
 
G
V
 
V
D
 
K
-
 
Y
L
 
L
S
 
E
P
 
K
A
 
E
G
 
K
T
 
S
A
 
L
P
 
P
V
 
V
R
 
E
I
 
V
R
 
D
G
 
A
T
 
A
R
 
G
D
 
G
L
 
F
T
 
A
P
 
G
-
 
G
-
 
V
L
 
I
E
 
E
Y
 
L
R
 
A
L
 
A
P
 
T
V
 
V
P
 
S
S
|
S
A
x
Q
Q
 
Y
V
 
V
K
 
S
S
 
S
L
 
I
V
 
L
T
 
-
F
 
M
A
 
A
A
 
A
L
 
P
H
 
Y
A
 
A
D
 
H
G
 
Q
E
 
P
T
 
V
R
 
-
I
 
-
I
 
-
E
 
-
S
 
-
I
 
-
R
 
-
S
 
-
R
 
-
N
 
-
H
 
-
T
 
T
E
 
L
L
 
R
M
 
L
L
 
V
G
 
G
L
 
G
E
 
K
T
 
P
I
 
I
D
 
S
R
 
Q
P
 
P
D
 
Y
G
 
I
E
 
D
R
 
M
V
 
T
I
 
I
V
 
A
I
 
M
P
 
-
G
 
-
R
 
-
K
 
-
T
 
-
I
 
-
V
 
-
A
 
M
R
 
A
S
 
S
F
 
F
Y
 
G
I
 
I
P
 
K
A
 
V
D
 
E
P
 
R
S
 
S
A
 
A
A
 
E
-
 
D
-
 
P
-
 
N
C
 
T
F
 
Y
I
 
L
V
 
I
A
 
P
L
 
K
G
 
G
L
 
V
L
 
Y
G
 
K
S
 
N
N
 
P
S
 
P
E
 
E
I
 
Y
I
 
V
I
 
V
R
 
E
D
 
S
V
 
D
C
 
A
L
 
S
N
 
S
P
 
A
T
 
T
R
 
-
V
 
-
E
 
-
F
 
-
I
 
Y
P
 
P
L
 
L
L
 
A
T
 
V
G
 
A
A
 
A
-
 
I
-
 
T
G
 
G
A
 
T
D
 
T
I
 
C
T
 
T
I
 
I
E
 
P
N
 
N
S
 
-
R
 
-
I
 
-
I
 
I
G
 
G
G
 
S
E
 
E
T
 
S
I
 
L
G
 
Q
D
 
G
I
 
D
L
 
A
V
 
R
R
 
F
S
 
A
T
 
V
R
 
E
T
 
V
L
 
L
K
 
R
P
 
P
L
 
M
-
 
G
-
 
C
-
 
A
-
 
V
-
 
E
V
 
Q
I
 
T
S
 
A
N
 
T
P
 
S
T
 
T
V
 
T
V
 
V
A
 
T
G
 
G
-
 
P
-
 
P
-
 
I
-
 
G
-
 
T
-
 
L
-
 
K
V
 
A
I
 
I
D
 
P
E
 
H
L
 
V
P
 
D
M
 
M
L
 
E
S
 
P
V
 
M
L
 
T
S
 
D
A
 
A
F
 
F
S
 
L
-
 
T
-
 
A
-
 
A
-
 
V
-
 
L
-
 
A
-
 
A
-
 
V
-
 
A
S
 
D
G
 
G
E
 
T
F
 
T
E
 
Q
L
 
I
H
 
T
N
 
G
A
 
I
E
 
A
E
 
N
L
 
Q
R
 
R
T
 
V
K
 
K
E
 
E
S
 
C
D
 
N
R
 
R
I
 
I
N
 
A
A
 
A
I
 
M
V
 
K
V
 
D
N
 
Q
L
 
L
E
 
A
R
 
K
L
 
F
G
 
G
F
 
V
D
 
Q
C
 
C
E
 
N
Q
 
E
Y
 
L
P
 
E
D
 
D
G
 
G
F
 
I
R
 
E
V
 
V
I
 
I
G
 
G
R
 
K
R
 
P
C
 
Y
R
 
Q
P
 
E
V
 
L
G
 
R
Q
 
N
V
 
P
T
 
V
-
 
E
-
 
G
V
 
I
A
 
Y
C
 
C
F
 
Y
D
 
D
D
 
D
H
 
H
R
 
R
I
 
V
A
 
A
M
 
M
S
 
S
F
 
H
A
 
S
V
 
V
A
 
L
A
 
S
R
 
T
A
 
I
T
 
S
G
 
P
E
 
H
G
 
P
I
 
V
A
 
L
L
 
I
S
 
L
D
 
E
S
 
R
D
 
E
V
 
C
V
 
T
G
 
A
V
 
K
S
 
T
F
 
W
P
 
P
N
 
G
F
 
W
F
 
W
E
 
D
I
 
I
I
 
L
E
 
S
N
 
Q
L
 
F

Sites not aligning to the query:

2pq9A E. Coli epsps liganded with (r)-difluoromethyl tetrahedral reaction intermediate analog (see paper)
24% identity, 96% coverage: 11:427/434 of query aligns to 18:418/427 of 2pq9A

query
sites
2pq9A
L
 
L
P
 
P
P
 
G
D
 
S
K
|
K
S
|
S
I
 
V
S
 
S
H
 
N
R
|
R
A
 
A
A
 
L
L
 
L
I
 
L
G
 
A
S
 
A
L
 
L
S
 
A
E
 
H
G
 
G
V
 
K
T
 
T
E
 
V
I
 
L
T
 
T
N
 
N
F
 
L
S
 
L
A
 
D
G
 
S
F
 
D
D
|
D
N
 
V
Q
 
R
S
 
H
T
 
M
L
 
L
G
 
N
V
 
A
L
 
L
H
 
T
D
 
A
A
 
L
G
 
G
I
 
V
E
 
S
V
 
Y
S
 
T
Q
 
L
H
 
S
E
 
-
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
-
G
 
A
R
 
D
R
 
R
I
 
T
R
 
R
K
 
C
V
 
E
I
 
I
I
 
I
S
 
G
S
 
N
R
 
G
G
 
G
-
 
P
L
 
L
W
 
H
S
 
A
F
 
E
T
 
G
A
 
A
P
 
L
E
 
E
K
 
-
P
 
-
L
 
L
M
 
F
C
 
L
N
 
G
N
|
N
S
 
A
G
|
G
S
x
T
T
 
A
M
 
M
R
 
R
M
 
P
F
 
L
A
 
A
G
 
A
I
 
A
L
 
L
A
 
C
A
 
L
Q
 
G
P
 
S
F
 
N
E
 
D
S
 
I
E
 
V
L
 
L
V
 
T
G
 
G
D
 
E
S
x
P
S
 
R
L
 
M
M
 
K
K
 
E
R
|
R
P
 
P
M
 
I
K
 
G
R
 
H
V
 
L
A
 
V
D
 
D
P
 
A
L
 
L
R
 
R
Q
 
L
M
 
G
G
 
G
A
 
A
G
 
K
V
 
I
D
 
T
-
 
Y
L
 
L
S
 
E
P
 
Q
A
 
E
G
 
N
T
 
Y
A
 
P
P
 
P
V
 
L
R
 
R
I
 
L
R
 
Q
G
 
G
T
 
G
R
 
F
D
 
T
L
 
G
T
 
G
P
 
N
L
 
V
E
 
D
Y
 
V
R
 
D
L
 
G
P
 
S
V
 
V
P
x
S
S
|
S
A
x
Q
Q
 
F
V
 
L
K
 
T
S
 
A
L
 
L
V
 
L
T
 
M
F
 
T
A
 
A
A
 
P
L
 
L
H
 
A
-
 
P
A
 
E
D
 
D
G
 
T
E
 
V
T
 
I
R
 
R
I
 
I
I
 
K
E
 
G
S
 
D
I
 
L
R
 
V
S
|
S
R
 
K
N
 
P
H
x
Y
T
 
I
E
 
D
L
 
I
M
 
T
L
 
L
G
 
N
L
 
L
E
 
M
T
 
K
-
 
T
-
 
F
-
 
G
-
 
V
-
 
E
I
 
I
D
 
E
R
 
N
P
 
Q
D
 
H
G
 
Y
E
 
Q
R
 
Q
V
 
F
I
 
V
V
 
V
I
 
K
P
 
G
G
 
G
R
 
Q
K
 
S
T
 
Y
I
 
Q
V
 
S
A
 
P
R
 
G
S
 
T
F
 
Y
Y
 
L
I
 
V
P
 
E
A
 
G
D
 
D
P
 
A
S
 
S
A
 
S
A
 
A
C
 
S
F
 
Y
I
 
F
V
 
L
A
 
A
L
 
A
G
 
A
L
 
A
L
 
I
G
 
K
S
 
G
N
 
G
S
 
T
E
 
-
I
 
V
I
 
K
I
 
V
R
 
T
D
 
G
V
 
I
C
 
G
L
 
R
N
 
N
P
 
S
T
 
M
R
 
Q
-
 
G
-
 
D
V
 
I
E
 
R
F
 
F
I
 
A
P
 
D
L
 
V
L
 
L
T
 
E
G
 
K
A
 
M
G
 
G
A
 
A
D
 
T
I
 
I
T
 
-
I
 
-
E
 
-
N
 
-
S
 
-
R
 
-
I
 
-
I
 
-
G
 
-
G
 
-
E
 
-
T
 
C
I
 
W
G
 
G
D
 
D
I
 
D
L
 
Y
V
 
I
R
 
S
S
 
C
T
 
T
R
 
R
-
 
G
T
 
E
L
 
L
K
 
N
P
 
A
L
 
I
V
 
D
I
 
M
S
 
D
N
 
-
P
 
-
T
 
-
V
 
-
V
 
M
A
 
N
G
 
H
V
 
I
I
 
P
D
|
D
E
 
A
L
 
A
P
 
M
M
 
T
L
 
I
S
 
A
V
 
T
L
 
A
S
 
A
A
 
L
F
 
F
S
 
A
S
 
K
G
 
G
E
 
T
F
 
T
E
 
T
L
 
L
H
 
R
N
 
N
A
 
I
E
 
Y
E
x
N
L
 
W
R
 
R
T
 
V
K
|
K
E
|
E
S
 
T
D
 
D
R
|
R
I
 
L
N
 
F
A
 
A
I
 
M
V
 
A
V
 
T
N
 
E
L
 
L
E
 
R
R
 
K
L
 
V
G
 
G
F
 
A
D
 
E
C
 
V
E
 
E
Q
 
E
Y
 
G
P
 
H
D
 
D
G
 
Y
F
 
I
R
 
R
V
 
I
I
 
T
G
 
-
R
 
-
R
 
P
C
 
P
R
 
E
P
 
K
V
 
L
G
 
N
Q
 
F
V
 
A
T
 
E
V
 
I
A
 
A
C
 
T
F
 
Y
D
 
N
D
 
D
H
|
H
R
|
R
I
 
M
A
 
A
M
 
M
S
 
C
F
 
F
A
 
S
V
 
L
A
 
V
A
 
A
R
 
-
A
 
L
T
 
S
G
 
D
E
 
T
G
 
P
I
 
V
A
 
T
L
 
I
S
 
L
D
 
D
S
 
P
D
 
K
V
 
C
V
 
T
G
 
A
V
x
K
S
 
T
F
 
F
P
 
P
N
 
D
F
 
Y
F
 
F
E
 
E

2aa9A Epsp synthase liganded with shikimate (see paper)
24% identity, 96% coverage: 11:427/434 of query aligns to 18:418/427 of 2aa9A

query
sites
2aa9A
L
 
L
P
 
P
P
 
G
D
 
S
K
|
K
S
|
S
I
 
V
S
 
S
H
 
N
R
|
R
A
 
A
A
 
L
L
 
L
I
 
L
G
 
A
S
 
A
L
 
L
S
 
A
E
 
H
G
 
G
V
 
K
T
 
T
E
 
V
I
 
L
T
 
T
N
 
N
F
 
L
S
 
L
A
 
D
G
 
S
F
 
D
D
|
D
N
 
V
Q
 
R
S
 
H
T
 
M
L
 
L
G
 
N
V
 
A
L
 
L
H
 
T
D
 
A
A
 
L
G
 
G
I
 
V
E
 
S
V
 
Y
S
 
T
Q
 
L
H
 
S
E
 
-
I
 
-
D
 
-
G
 
-
A
 
-
Y
 
-
G
 
A
R
 
D
R
 
R
I
 
T
R
 
R
K
 
C
V
 
E
I
 
I
I
 
I
S
 
G
S
 
N
R
 
G
G
 
G
-
 
P
L
 
L
W
 
H
S
 
A
F
 
E
T
 
G
A
 
A
P
 
L
E
 
E
K
 
-
P
 
-
L
 
L
M
 
F
C
 
L
N
 
G
N
|
N
S
 
A
G
 
G
S
x
T
T
 
A
M
 
M
R
 
R
M
 
P
F
 
L
A
 
A
G
 
A
I
 
A
L
 
L
A
 
C
A
 
L
Q
 
G
P
 
S
F
 
N
E
 
D
S
 
I
E
 
V
L
 
L
V
 
T
G
 
G
D
 
E
S
x
P
S
 
R
L
 
M
M
 
K
K
 
E
R
|
R
P
 
P
M
 
I
K
 
G
R
 
H
V
 
L
A
 
V
D
 
D
P
 
A
L
 
L
R
 
R
Q
 
L
M
 
G
G
 
G
A
 
A
G
 
K
V
 
I
D
 
T
-
 
Y
L
 
L
S
 
E
P
 
Q
A
 
E
G
 
N
T
 
Y
A
 
P
P
 
P
V
 
L
R
 
R
I
 
L
R
 
Q
G
 
G
T
 
G
R
 
F
D
 
T
L
 
G
T
 
G
P
 
N
L
 
V
E
 
D
Y
 
V
R
 
D
L
 
G
P
 
S
V
 
V
P
 
S
S
 
S
A
x
Q
Q
 
F
V
 
L
K
 
T
S
 
A
L
 
L
V
 
L
T
 
M
F
 
T
A
 
A
A
 
P
L
 
L
H
 
A
-
 
P
A
 
E
D
 
D
G
 
T
E
 
V
T
 
I
R
 
R
I
 
I
I
 
K
E
 
G
S
 
D
I
 
L
R
 
V
S
 
S
R
 
K
N
 
P
H
x
Y
T
 
I
E
 
D
L
 
I
M
 
T
L
 
L
G
 
N
L
 
L
E
 
M
T
 
K
-
 
T
-
 
F
-
 
G
-
 
V
-
 
E
I
 
I
D
 
E
R
 
N
P
 
Q
D
 
H
G
 
Y
E
 
Q
R
 
Q
V
 
F
I
 
V
V
 
V
I
 
K
P
 
G
G
 
G
R
 
Q
K
 
S
T
 
Y
I
 
Q
V
 
S
A
 
P
R
 
G
S
 
T
F
 
Y
Y
 
L
I
 
V
P
 
E
A
 
G
D
 
D
P
 
A
S
 
S
A
 
S
A
 
A
C
 
S
F
 
Y
I
 
F
V
 
L
A
 
A
L
 
A
G
 
A
L
 
A
L
 
I
G
 
K
S
 
G
N
 
G
S
 
T
E
 
-
I
 
V
I
 
K
I
 
V
R
 
T
D
 
G
V
 
I
C
 
G
L
 
R
N
 
N
P
 
S
T
 
M
R
 
Q
-
 
G
-
 
D
V
 
I
E
 
R
F
 
F
I
 
A
P
 
D
L
 
V
L
 
L
T
 
E
G
 
K
A
 
M
G
 
G
A
 
A
D
 
T
I
 
I
T
 
-
I
 
-
E
 
-
N
 
-
S
 
-
R
 
-
I
 
-
I
 
-
G
 
-
G
 
-
E
 
-
T
 
C
I
 
W
G
 
G
D
 
D
I
 
D
L
 
Y
V
 
I
R
 
S
S
 
C
T
 
T
R
 
R
-
 
G
T
 
E
L
 
L
K
 
N
P
 
A
L
 
I
V
 
D
I
 
M
S
 
D
N
 
-
P
 
-
T
 
-
V
 
-
V
 
M
A
 
N
G
 
H
V
 
I
I
 
P
D
|
D
E
 
A
L
 
A
P
 
M
M
 
T
L
 
I
S
 
A
V
 
T
L
 
A
S
 
A
A
 
L
F
 
F
S
 
A
S
 
K
G
 
G
E
 
T
F
 
T
E
 
T
L
 
L
H
 
R
N
 
N
A
 
I
E
 
Y
E
 
N
L
 
W
R
 
R
T
 
V
K
|
K
E
|
E
S
 
T
D
 
D
R
 
R
I
 
L
N
 
F
A
 
A
I
 
M
V
 
A
V
 
T
N
 
E
L
 
L
E
 
R
R
 
K
L
 
V
G
 
G
F
 
A
D
 
E
C
 
V
E
 
E
Q
 
E
Y
 
G
P
 
H
D
 
D
G
 
Y
F
 
I
R
 
R
V
 
I
I
 
T
G
 
-
R
 
-
R
 
P
C
 
P
R
 
E
P
 
K
V
 
L
G
 
N
Q
 
F
V
 
A
T
 
E
V
 
I
A
 
A
C
 
T
F
 
Y
D
 
N
D
 
D
H
|
H
R
|
R
I
 
M
A
 
A
M
 
M
S
 
C
F
 
F
A
 
S
V
 
L
A
 
V
A
 
A
R
 
-
A
 
L
T
 
S
G
 
D
E
 
T
G
 
P
I
 
V
A
 
T
L
 
I
S
 
L
D
 
D
S
 
P
D
 
K
V
 
C
V
 
T
G
 
A
V
x
K
S
 
T
F
 
F
P
 
P
N
 
D
F
 
Y
F
 
F
E
 
E

Query Sequence

>WP_012467016.1 NCBI__GCF_000020465.1:WP_012467016.1
MAVFKGEVTALPPDKSISHRAALIGSLSEGVTEITNFSAGFDNQSTLGVLHDAGIEVSQH
EIDGAYGRRIRKVIISSRGLWSFTAPEKPLMCNNSGSTMRMFAGILAAQPFESELVGDSS
LMKRPMKRVADPLRQMGAGVDLSPAGTAPVRIRGTRDLTPLEYRLPVPSAQVKSLVTFAA
LHADGETRIIESIRSRNHTELMLGLETIDRPDGERVIVIPGRKTIVARSFYIPADPSAAC
FIVALGLLGSNSEIIIRDVCLNPTRVEFIPLLTGAGADITIENSRIIGGETIGDILVRST
RTLKPLVISNPTVVAGVIDELPMLSVLSAFSSGEFELHNAEELRTKESDRINAIVVNLER
LGFDCEQYPDGFRVIGRRCRPVGQVTVACFDDHRIAMSFAVAARATGEGIALSDSDVVGV
SFPNFFEIIENLKA

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory