SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_072905141.1 NCBI__GCF_900142125.1:WP_072905141.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

Q9S400 3-phosphoshikimate 1-carboxyvinyltransferase; 5-enolpyruvylshikimate-3-phosphate synthase; EPSP synthase; EPSPS; EC 2.5.1.19 from Streptococcus pneumoniae serotype 4 (strain ATCC BAA-334 / TIGR4) (see paper)
50% identity, 97% coverage: 12:430/432 of query aligns to 7:424/427 of Q9S400

query
sites
Q9S400
V
 
I
T
 
R
S
 
H
V
 
L
K
 
H
G
 
G
E
 
S
I
 
I
V
 
R
V
 
V
P
 
P
G
 
G
D
 
D
K
 
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
S
I
 
I
M
 
I
F
 
F
A
 
G
S
 
S
L
 
L
A
 
A
K
 
E
G
 
G
E
 
E
S
 
T
R
 
K
V
 
V
V
 
Y
G
 
D
L
 
I
L
 
L
R
 
R
G
 
G
E
 
E
D
 
D
C
 
V
M
 
L
S
 
S
T
 
T
L
 
M
K
 
Q
I
 
V
F
 
F
Q
 
R
A
 
D
M
 
L
G
 
G
V
 
V
E
 
E
V
 
I
E
 
E
E
 
D
R
 
K
G
 
-
E
 
D
D
 
G
E
 
V
L
 
I
I
 
T
I
 
I
Q
 
Q
G
 
G
R
 
V
G
 
G
I
 
M
D
 
A
G
 
G
L
 
L
L
 
K
E
 
A
P
 
P
D
 
Q
D
 
N
V
 
A
L
 
L
D
 
N
C
 
M
G
 
G
N
 
N
S
 
S
G
 
G
T
 
T
T
 
S
M
 
I
R
 
R
L
 
L
M
 
I
S
 
S
G
 
G
I
 
V
L
 
L
A
 
A
A
 
G
Q
 
A
P
 
D
F
 
F
Y
 
E
S
 
V
V
 
E
M
 
M
T
 
F
G
 
G
D
 
D
Q
 
D
Y
 
S
L
 
L
R
 
S
K
 
K
R
 
R
P
 
P
M
 
M
G
 
D
R
 
R
V
 
V
I
 
T
D
 
L
P
 
P
L
 
L
R
 
K
E
 
K
M
 
M
G
 
G
A
 
V
K
 
S
I
 
I
L
 
S
G
 
G
R
 
Q
D
 
T
G
 
E
N
 
R
K
 
D
K
 
L
A
 
P
P
 
P
L
 
L
T
 
R
I
 
L
D
 
K
G
 
G
-
 
T
G
 
K
G
 
N
L
 
L
K
 
R
P
 
P
A
 
I
E
 
H
Y
 
Y
H
 
E
S
 
L
P
 
P
V
 
I
S
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
A
L
 
L
L
 
M
L
 
F
A
 
A
G
 
A
M
 
L
Q
 
Q
I
 
A
E
 
K
G
 
G
T
 
E
T
 
S
T
 
V
V
 
I
Y
 
I
E
 
E
P
 
K
H
 
E
L
 
Y
S
 
T
R
 
R
D
 
N
H
 
H
S
 
T
E
 
E
R
 
D
M
 
M
L
 
L
C
 
K
Y
 
Q
F
 
F
G
 
G
A
 
G
E
 
H
V
 
L
E
 
-
S
 
S
F
 
V
D
 
D
G
 
G
G
 
K
A
 
K
-
 
I
R
 
T
V
 
V
T
 
Q
G
 
G
P
 
P
V
 
Q
V
 
K
L
 
L
E
 
T
G
 
G
R
 
Q
E
 
K
V
 
V
F
 
V
V
 
V
P
 
P
G
 
G
D
 
D
I
 
I
S
 
S
S
 
S
A
 
A
A
 
A
F
 
F
F
 
W
L
 
L
V
 
V
A
 
A
G
 
G
L
 
L
I
 
I
V
 
A
P
 
P
D
 
N
S
 
S
E
 
R
L
 
L
L
 
V
L
 
L
K
 
Q
N
 
N
V
 
V
G
 
G
V
 
I
N
 
N
P
 
E
T
 
T
R
 
R
S
 
T
G
 
G
I
 
I
I
 
I
D
 
D
I
 
V
L
 
I
Q
 
R
Q
 
A
M
 
M
G
 
G
G
 
G
S
 
K
I
 
L
E
 
E
L
 
I
L
 
T
N
 
E
Q
 
I
R
 
-
E
 
-
L
 
-
S
 
-
G
 
-
E
 
D
P
 
P
V
 
V
A
 
A
D
 
K
-
 
S
-
 
A
-
 
T
L
 
L
L
 
I
V
 
V
K
 
E
S
 
S
S
 
S
Q
 
D
L
 
L
K
 
K
G
 
G
I
 
T
E
 
E
I
 
I
G
 
G
G
 
G
E
 
A
L
 
L
V
 
I
P
 
P
R
 
R
A
 
L
I
 
I
D
|
D
E
 
E
F
 
L
P
 
P
V
 
I
V
 
I
S
 
A
V
 
L
A
 
L
A
 
A
A
 
T
F
 
Q
A
 
A
E
 
Q
G
 
G
V
 
V
T
 
T
T
 
V
I
 
I
R
 
K
D
 
D
A
 
A
K
 
E
E
 
E
L
 
L
R
 
K
V
 
V
K
|
K
E
 
E
T
 
T
D
 
D
R
 
R
I
 
I
A
 
Q
A
 
V
M
 
V
C
 
A
D
 
D
T
 
A
L
 
L
G
 
N
K
 
S
I
 
M
G
 
G
A
 
A
Q
 
D
I
 
I
E
 
T
P
 
P
L
 
T
E
 
A
D
 
D
G
 
G
M
 
M
R
 
I
V
 
I
T
 
K
G
 
G
G
 
K
K
 
S
S
 
A
L
 
L
S
 
H
G
 
G
G
 
A
T
 
R
V
 
V
N
 
N
S
 
T
F
 
F
G
 
G
D
 
D
H
 
H
R
 
R
I
 
I
A
 
G
M
 
M
S
 
M
M
 
T
A
 
A
V
 
I
A
 
A
A
 
A
L
 
L
R
 
L
-
 
V
A
 
A
S
 
D
G
 
G
E
 
E
V
 
V
T
 
E
I
 
L
E
 
D
D
 
R
T
 
A
G
 
E
C
 
A
T
 
I
S
 
N
T
 
T
S
 
S
F
 
Y
P
 
P
N
 
S
F
 
F
W
 
F
E
 
D
L
 
D
L
 
L
E
 
E
N
 
S
I
 
L

1rf6A Structural studies of streptococcus pneumoniae epsp synthase in s3p- glp bound state (see paper)
49% identity, 97% coverage: 12:430/432 of query aligns to 7:424/427 of 1rf6A

query
sites
1rf6A
V
 
I
T
 
R
S
 
H
V
 
L
K
 
H
G
 
G
E
 
I
I
 
I
V
 
R
V
 
V
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
S
I
 
I
M
 
I
F
 
F
A
 
G
S
 
S
L
 
L
A
 
A
K
 
E
G
 
G
E
 
E
S
 
T
R
 
K
V
 
V
V
 
Y
G
 
D
L
 
I
L
 
L
R
 
R
G
 
G
E
 
E
D
|
D
C
 
V
M
 
L
S
 
S
T
 
T
L
 
M
K
 
Q
I
 
V
F
 
F
Q
 
R
A
 
D
M
 
L
G
 
G
V
 
V
E
 
E
V
 
I
E
 
E
E
 
D
R
 
K
G
 
-
E
 
D
D
 
G
E
 
V
L
 
I
I
 
T
I
 
V
Q
 
Q
G
 
G
R
 
V
G
 
G
I
 
M
D
 
A
G
 
G
L
 
L
L
 
K
E
 
A
P
 
P
D
 
Q
D
 
N
V
 
A
L
 
L
D
 
N
C
 
M
G
 
G
N
|
N
S
 
S
G
|
G
T
|
T
T
 
S
M
 
I
R
 
R
L
 
L
M
 
I
S
 
S
G
 
G
I
 
V
L
 
L
A
 
A
A
 
G
Q
 
A
P
 
D
F
 
F
Y
 
E
S
 
V
V
 
E
M
 
M
T
 
F
G
 
G
D
 
D
Q
x
D
Y
 
S
L
 
L
R
 
S
K
 
K
R
|
R
P
 
P
M
 
M
G
 
D
R
 
R
V
 
V
I
 
T
D
 
L
P
 
P
L
 
L
R
 
K
E
 
K
M
 
M
G
 
G
A
 
V
K
 
S
I
 
I
L
 
S
G
 
G
R
 
Q
D
 
T
G
 
E
N
 
R
K
 
D
K
 
L
A
 
P
P
 
P
L
 
L
T
 
R
I
 
L
D
 
K
G
 
G
-
 
T
G
 
K
G
 
N
L
 
L
K
 
R
P
 
P
A
 
I
E
 
H
Y
 
Y
H
 
E
S
 
L
P
 
P
V
 
I
S
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
A
L
 
L
L
 
M
L
 
F
A
 
A
G
 
A
M
 
L
Q
 
Q
I
 
A
E
 
K
G
 
G
T
 
E
T
 
S
T
 
V
V
 
I
Y
 
I
E
 
E
P
 
K
H
 
E
L
 
Y
S
 
T
R
|
R
D
 
N
H
 
H
S
 
T
E
 
E
R
 
D
M
 
M
L
 
L
C
 
Q
Y
 
Q
F
 
F
G
 
G
A
 
G
E
 
H
V
 
L
E
 
-
S
 
S
F
 
V
D
 
D
G
 
G
G
 
K
A
 
K
-
 
I
R
 
T
V
 
V
T
 
Q
G
 
G
P
 
P
V
 
Q
V
 
K
L
 
L
E
 
T
G
 
G
R
 
Q
E
 
K
V
 
V
F
 
V
V
 
V
P
 
P
G
 
G
D
 
D
I
 
I
S
 
S
S
 
S
A
 
A
A
 
A
F
 
F
F
 
W
L
 
L
V
 
V
A
 
A
G
 
G
L
 
L
I
 
I
V
 
A
P
 
P
D
 
N
S
 
S
E
 
R
L
 
L
L
 
V
L
 
L
K
 
Q
N
 
N
V
 
V
G
 
G
V
 
I
N
 
N
P
 
E
T
 
T
R
 
R
S
 
T
G
 
G
I
 
I
I
 
I
D
 
D
I
 
V
L
 
I
Q
 
R
Q
 
A
M
 
M
G
 
G
G
 
G
S
 
K
I
 
L
E
 
E
L
 
I
L
 
T
N
 
E
Q
 
I
R
 
-
E
 
-
L
 
-
S
 
-
G
 
-
E
 
D
P
 
P
V
 
V
A
 
A
D
 
K
-
 
S
-
 
A
-
 
T
L
 
L
L
 
I
V
 
V
K
 
E
S
 
S
S
 
S
Q
 
D
L
 
L
K
 
K
G
 
G
I
 
T
E
 
E
I
 
I
G
 
C
G
 
G
E
 
A
L
 
L
V
 
I
P
 
P
R
 
R
A
 
L
I
|
I
D
|
D
E
 
E
F
 
L
P
 
P
V
 
I
V
 
I
S
 
A
V
 
L
A
 
L
A
 
A
A
 
T
F
 
Q
A
 
A
E
 
Q
G
 
G
V
 
V
T
 
T
T
 
V
I
 
I
R
 
K
D
 
D
A
 
A
K
 
E
E
 
E
L
 
L
R
 
K
V
 
V
K
|
K
E
|
E
T
 
T
D
 
D
R
|
R
I
 
I
A
 
Q
A
 
V
M
 
V
C
 
A
D
 
D
T
 
A
L
 
L
G
 
N
K
 
S
I
 
M
G
 
G
A
 
A
Q
 
D
I
 
I
E
 
T
P
 
P
L
 
T
E
 
A
D
 
D
G
 
G
M
 
M
R
 
I
V
 
I
T
 
K
G
 
G
G
 
K
K
 
S
S
 
A
L
 
L
S
 
H
G
 
G
G
 
A
T
 
R
V
 
V
N
 
N
S
 
T
F
 
F
G
 
G
D
 
D
H
|
H
R
|
R
I
 
I
A
 
G
M
 
M
S
 
M
M
 
T
A
 
A
V
 
I
A
 
A
A
 
A
L
 
L
R
 
L
-
 
V
A
 
A
S
 
D
G
 
G
E
 
E
V
 
V
T
 
E
I
 
L
E
 
D
D
 
R
T
 
A
G
 
E
C
 
A
T
 
I
S
 
N
T
|
T
S
 
S
F
 
Y
P
 
P
N
 
S
F
 
F
W
 
F
E
 
D
L
 
D
L
 
L
E
 
E
N
 
S
I
 
L

1rf4A Structural studies of streptococcus pneumoniae epsp synthase, tetrahedral intermediate bound state (see paper)
49% identity, 97% coverage: 12:430/432 of query aligns to 7:424/427 of 1rf4A

query
sites
1rf4A
V
 
I
T
 
R
S
 
H
V
 
L
K
 
H
G
 
G
E
 
I
I
 
I
V
 
R
V
 
V
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
S
I
 
I
M
 
I
F
 
F
A
 
G
S
 
S
L
 
L
A
 
A
K
 
E
G
 
G
E
 
E
S
 
T
R
 
K
V
 
V
V
 
Y
G
 
D
L
 
I
L
 
L
R
 
R
G
 
G
E
 
E
D
|
D
C
 
V
M
 
L
S
 
S
T
 
T
L
 
M
K
 
Q
I
 
V
F
 
F
Q
 
R
A
 
D
M
 
L
G
 
G
V
 
V
E
 
E
V
 
I
E
 
E
E
 
D
R
 
K
G
 
-
E
 
D
D
 
G
E
 
V
L
 
I
I
 
T
I
 
V
Q
 
Q
G
 
G
R
 
V
G
 
G
I
 
M
D
 
A
G
 
G
L
 
L
L
 
K
E
 
A
P
 
P
D
 
Q
D
 
N
V
 
A
L
 
L
D
 
N
C
 
M
G
 
G
N
|
N
S
 
S
G
|
G
T
|
T
T
 
S
M
 
I
R
 
R
L
 
L
M
 
I
S
 
S
G
 
G
I
 
V
L
 
L
A
 
A
A
 
G
Q
 
A
P
 
D
F
 
F
Y
 
E
S
 
V
V
 
E
M
 
M
T
 
F
G
 
G
D
 
D
Q
x
D
Y
 
S
L
 
L
R
 
S
K
 
K
R
|
R
P
 
P
M
 
M
G
 
D
R
 
R
V
 
V
I
 
T
D
 
L
P
 
P
L
 
L
R
 
K
E
 
K
M
 
M
G
 
G
A
 
V
K
 
S
I
 
I
L
 
S
G
 
G
R
 
Q
D
 
T
G
 
E
N
 
R
K
 
D
K
 
L
A
 
P
P
 
P
L
 
L
T
 
R
I
 
L
D
 
K
G
 
G
-
 
T
G
 
K
G
 
N
L
 
L
K
 
R
P
 
P
A
 
I
E
 
H
Y
 
Y
H
 
E
S
 
L
P
 
P
V
 
I
S
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
A
L
 
L
L
 
M
L
 
F
A
 
A
G
 
A
M
 
L
Q
 
Q
I
 
A
E
 
K
G
 
G
T
 
E
T
 
S
T
 
V
V
 
I
Y
 
I
E
 
E
P
 
K
H
 
E
L
 
Y
S
 
T
R
|
R
D
 
N
H
 
H
S
 
T
E
 
E
R
 
D
M
 
M
L
 
L
C
 
Q
Y
 
Q
F
 
F
G
 
G
A
 
G
E
 
H
V
 
L
E
 
-
S
 
S
F
 
V
D
 
D
G
 
G
G
 
K
A
 
K
-
 
I
R
 
T
V
 
V
T
 
Q
G
 
G
P
 
P
V
 
Q
V
 
K
L
 
L
E
 
T
G
 
G
R
 
Q
E
 
K
V
 
V
F
 
V
V
 
V
P
 
P
G
 
G
D
 
D
I
 
I
S
 
S
S
 
S
A
 
A
A
 
A
F
 
F
F
 
W
L
 
L
V
 
V
A
 
A
G
 
G
L
 
L
I
 
I
V
 
A
P
 
P
D
 
N
S
 
S
E
 
R
L
 
L
L
 
V
L
 
L
K
 
Q
N
 
N
V
 
V
G
 
G
V
 
I
N
 
N
P
 
E
T
 
T
R
 
R
S
 
T
G
 
G
I
 
I
I
 
I
D
 
D
I
 
V
L
 
I
Q
 
R
Q
 
A
M
 
M
G
 
G
G
 
G
S
 
K
I
 
L
E
 
E
L
 
I
L
 
T
N
 
E
Q
 
I
R
 
-
E
 
-
L
 
-
S
 
-
G
 
-
E
 
D
P
 
P
V
 
V
A
 
A
D
 
K
-
 
S
-
 
A
-
 
T
L
 
L
L
 
I
V
 
V
K
 
E
S
 
S
S
 
S
Q
 
D
L
 
L
K
 
K
G
 
G
I
 
T
E
 
E
I
 
I
G
 
C
G
 
G
E
 
A
L
 
L
V
 
I
P
 
P
R
 
R
A
 
L
I
 
I
D
|
D
E
 
E
F
 
L
P
 
P
V
 
I
V
 
I
S
 
A
V
 
L
A
 
L
A
 
A
A
 
T
F
 
Q
A
 
A
E
 
Q
G
 
G
V
 
V
T
 
T
T
 
V
I
 
I
R
 
K
D
 
D
A
 
A
K
 
E
E
 
E
L
 
L
R
 
K
V
 
V
K
|
K
E
|
E
T
 
T
D
 
D
R
|
R
I
 
I
A
 
Q
A
 
V
M
 
V
C
 
A
D
 
D
T
 
A
L
 
L
G
 
N
K
 
S
I
 
M
G
 
G
A
 
A
Q
 
D
I
 
I
E
 
T
P
 
P
L
 
T
E
 
A
D
 
D
G
 
G
M
 
M
R
 
I
V
 
I
T
 
K
G
 
G
G
 
K
K
 
S
S
 
A
L
 
L
S
 
H
G
 
G
G
 
A
T
 
R
V
 
V
N
 
N
S
 
T
F
 
F
G
 
G
D
 
D
H
|
H
R
|
R
I
 
I
A
 
G
M
 
M
S
 
M
M
 
T
A
 
A
V
 
I
A
 
A
A
 
A
L
 
L
R
 
L
-
 
V
A
 
A
S
 
D
G
 
G
E
 
E
V
 
V
T
 
E
I
 
L
E
 
D
D
 
R
T
 
A
G
 
E
C
 
A
T
 
I
S
 
N
T
|
T
S
 
S
F
 
Y
P
 
P
N
 
S
F
 
F
W
 
F
E
 
D
L
 
D
L
 
L
E
 
E
N
 
S
I
 
L

Q83E11 3-phosphoshikimate 1-carboxyvinyltransferase; 5-enolpyruvylshikimate-3-phosphate synthase; EPSP synthase; EPSPS; EC 2.5.1.19 from Coxiella burnetii (strain RSA 493 / Nine Mile phase I)
50% identity, 97% coverage: 11:430/432 of query aligns to 7:425/438 of Q83E11

query
sites
Q83E11
P
 
P
V
 
S
T
 
Q
S
 
G
V
 
L
K
 
S
G
 
G
E
 
E
I
 
I
V
 
C
V
 
V
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
A
I
 
V
M
 
L
F
 
L
A
 
A
S
 
A
L
 
I
A
 
A
K
 
E
G
 
G
E
 
Q
S
 
T
R
 
Q
V
 
V
V
 
D
G
 
G
L
 
F
L
 
L
R
 
M
G
 
G
E
 
A
D
 
D
C
 
N
M
 
L
S
 
A
T
 
M
L
 
V
K
 
S
I
 
A
F
 
L
Q
 
Q
A
 
Q
M
 
M
G
 
G
V
 
A
E
 
S
V
 
I
E
 
Q
E
 
V
-
 
I
R
 
E
G
 
D
E
 
E
D
 
N
E
 
I
L
 
L
I
 
V
I
 
V
Q
 
E
G
 
G
R
 
V
G
 
G
I
 
M
D
 
T
G
 
G
L
 
L
L
 
Q
E
 
A
P
 
P
D
 
P
D
 
E
V
 
A
L
 
L
D
 
D
C
 
C
G
 
G
N
|
N
S
|
S
G
|
G
T
|
T
T
 
A
M
 
I
R
 
R
L
 
L
M
 
L
S
 
S
G
 
G
I
 
L
L
 
L
A
 
A
A
 
G
Q
 
Q
P
 
P
F
 
F
Y
 
N
S
 
T
V
 
V
M
 
L
T
 
T
G
 
G
D
 
D
Q
 
S
Y
 
S
L
 
L
R
 
Q
K
 
R
R
|
R
P
 
P
M
 
M
G
 
K
R
 
R
V
 
I
I
 
I
D
 
D
P
 
P
L
 
L
R
 
T
E
 
L
M
 
M
G
 
G
A
 
A
K
 
K
I
 
I
L
 
-
G
 
D
R
 
S
D
 
T
G
 
G
N
 
N
K
 
V
K
 
P
A
 
-
P
 
P
L
 
L
T
 
K
I
 
I
D
 
Y
G
 
G
G
 
N
G
 
P
-
 
R
L
 
L
K
 
T
P
 
G
A
 
I
E
 
H
Y
 
Y
H
 
Q
S
 
L
P
 
P
V
 
M
S
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
C
L
 
L
L
 
L
L
 
L
A
 
A
G
 
G
M
 
L
Q
 
Y
I
 
A
E
 
R
G
 
G
T
 
K
T
 
T
T
 
C
V
 
I
Y
 
T
E
 
E
P
 
P
H
 
A
L
 
P
S
 
S
R
 
R
D
 
D
H
 
H
S
 
T
E
 
E
R
 
R
M
 
L
L
 
L
C
 
K
Y
 
H
F
 
F
G
 
H
A
 
Y
E
 
T
V
 
L
E
 
Q
S
 
K
F
 
D
D
 
K
G
 
Q
G
 
S
A
 
I
R
 
C
V
 
V
T
 
S
G
 
G
P
 
G
V
 
G
V
 
K
L
 
L
E
 
K
G
 
A
R
 
N
E
 
D
V
 
I
F
 
S
V
 
I
P
 
P
G
 
G
D
 
D
I
 
I
S
 
S
S
 
S
A
 
A
A
 
A
F
 
F
F
 
F
L
 
I
V
 
V
A
 
A
G
 
A
L
 
T
I
 
I
V
 
T
P
 
P
D
 
G
S
 
S
E
 
A
L
 
I
L
 
R
L
 
L
K
 
C
N
 
R
V
 
V
G
 
G
V
 
V
N
 
N
P
 
P
T
 
T
R
 
R
S
 
L
G
 
G
I
 
V
I
 
I
D
 
N
I
 
L
L
 
L
Q
 
K
Q
 
M
M
 
M
G
 
G
G
 
A
S
 
D
I
 
I
E
 
E
L
 
V
L
 
T
N
 
H
Q
 
Y
R
 
T
E
 
E
L
 
K
S
 
N
G
 
E
E
 
E
P
 
P
V
 
T
A
 
A
D
 
D
L
 
I
L
 
T
V
 
V
K
 
R
S
 
H
S
 
A
Q
 
R
L
 
L
K
 
K
G
 
G
I
 
I
E
 
D
I
 
I
G
 
P
G
 
P
E
 
D
L
 
Q
V
 
V
P
 
P
R
 
L
A
 
T
I
 
I
D
|
D
E
 
E
F
 
F
P
 
P
V
 
V
V
 
L
S
 
L
V
 
I
A
 
A
A
 
A
A
 
A
F
 
V
A
 
A
E
 
Q
G
 
G
V
 
K
T
 
T
T
 
V
I
 
L
R
 
R
D
 
D
A
 
A
K
 
A
E
 
E
L
 
L
R
 
R
V
 
V
K
|
K
E
 
E
T
 
T
D
 
D
R
|
R
I
 
I
A
 
A
A
 
A
M
 
M
C
 
V
D
 
D
T
 
G
L
 
L
G
 
Q
K
 
K
I
 
L
G
 
G
A
 
I
Q
 
A
I
 
A
E
 
E
P
 
S
L
 
L
E
 
P
D
 
D
G
 
G
M
 
V
R
 
I
V
 
I
T
 
Q
G
 
G
G
 
G
K
 
-
S
 
T
L
 
L
S
 
E
G
 
G
G
 
G
T
 
E
V
 
V
N
 
N
S
 
S
F
 
Y
G
 
D
D
 
D
H
 
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
A
M
 
F
A
 
A
V
 
V
A
 
A
A
 
G
L
 
T
R
 
L
A
 
A
S
 
K
G
 
G
E
 
P
V
 
V
T
 
R
I
 
I
E
 
R
D
 
N
T
 
C
G
 
D
C
 
N
T
 
V
S
 
K
T
 
T
S
 
S
F
 
F
P
 
P
N
 
N
F
 
F
W
 
V
E
 
E
L
 
L
L
 
A
E
 
N
N
 
E
I
 
V

3slhD 1.70 angstrom resolution structure of 3-phosphoshikimate 1- carboxyvinyltransferase (aroa) from coxiella burnetii in complex with shikimate-3-phosphate and glyphosate
50% identity, 97% coverage: 11:430/432 of query aligns to 9:427/440 of 3slhD

query
sites
3slhD
P
 
P
V
 
S
T
 
Q
S
 
G
V
 
L
K
 
S
G
 
G
E
 
E
I
 
I
V
 
C
V
 
V
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
A
I
 
V
M
 
L
F
 
L
A
 
A
S
 
A
L
 
I
A
 
A
K
 
E
G
 
G
E
 
Q
S
 
T
R
 
Q
V
 
V
V
 
D
G
 
G
L
 
F
L
 
L
R
 
M
G
 
G
E
 
A
D
|
D
C
 
N
M
 
L
S
 
A
T
 
M
L
 
V
K
 
S
I
 
A
F
 
L
Q
 
Q
A
 
Q
M
 
M
G
 
G
V
 
A
E
 
S
V
 
I
E
 
Q
E
 
V
-
 
I
R
 
E
G
 
D
E
 
E
D
 
N
E
 
I
L
 
L
I
 
V
I
 
V
Q
 
E
G
 
G
R
 
V
G
 
G
I
 
M
D
 
T
G
 
G
L
 
L
L
 
Q
E
 
A
P
 
P
D
 
P
D
 
E
V
 
A
L
 
L
D
 
D
C
 
C
G
 
G
N
|
N
S
 
S
G
|
G
T
|
T
T
 
A
M
 
I
R
 
R
L
 
L
M
 
L
S
 
S
G
 
G
I
 
L
L
 
L
A
 
A
A
 
G
Q
 
Q
P
 
P
F
 
F
Y
 
N
S
 
T
V
 
V
M
 
L
T
 
T
G
 
G
D
 
D
Q
 
S
Y
 
S
L
 
L
R
 
Q
K
 
R
R
|
R
P
 
P
M
 
M
G
 
K
R
 
R
V
 
I
I
 
I
D
 
D
P
 
P
L
 
L
R
 
T
E
 
L
M
 
M
G
 
G
A
 
A
K
 
K
I
 
I
L
 
-
G
 
D
R
 
S
D
 
T
G
 
G
N
 
N
K
 
V
K
 
P
A
 
-
P
 
P
L
 
L
T
 
K
I
 
I
D
 
Y
G
 
G
G
 
N
G
 
P
-
 
R
L
 
L
K
 
T
P
 
G
A
 
I
E
 
H
Y
 
Y
H
 
Q
S
 
L
P
 
P
V
 
M
S
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
C
L
 
L
L
 
L
L
 
L
A
 
A
G
 
G
M
 
L
Q
 
Y
I
 
A
E
 
R
G
 
G
T
 
K
T
 
T
T
 
C
V
 
I
Y
 
T
E
 
E
P
 
P
H
 
A
L
 
P
S
 
S
R
|
R
D
 
D
H
 
H
S
 
T
E
 
E
R
 
R
M
 
L
L
 
L
C
 
K
Y
 
H
F
 
F
G
 
H
A
 
Y
E
 
T
V
 
L
E
 
Q
S
 
K
F
 
D
D
 
K
G
 
Q
G
 
S
A
 
I
R
 
C
V
 
V
T
 
S
G
 
G
P
 
G
V
 
G
V
 
K
L
 
L
E
 
K
G
 
A
R
 
N
E
 
D
V
 
I
F
 
S
V
 
I
P
 
P
G
 
G
D
 
D
I
 
I
S
 
S
S
 
S
A
 
A
A
 
A
F
 
F
F
 
F
L
 
I
V
 
V
A
 
A
G
 
A
L
 
T
I
 
I
V
 
T
P
 
P
D
 
G
S
 
S
E
 
A
L
 
I
L
 
R
L
 
L
K
 
C
N
 
R
V
 
V
G
 
G
V
 
V
N
 
N
P
 
P
T
 
T
R
 
R
S
 
L
G
 
G
I
 
V
I
 
I
D
 
N
I
 
L
L
 
L
Q
 
K
Q
 
M
M
 
M
G
 
G
G
 
A
S
 
D
I
 
I
E
 
E
L
 
V
L
 
T
N
 
H
Q
 
Y
R
 
T
E
 
E
L
 
K
S
 
N
G
 
E
E
 
E
P
 
P
V
 
T
A
 
A
D
 
D
L
 
I
L
 
T
V
 
V
K
 
R
S
 
H
S
 
A
Q
 
R
L
 
L
K
 
K
G
 
G
I
 
I
E
 
D
I
 
I
G
 
P
G
 
P
E
 
D
L
 
Q
V
 
V
P
 
P
R
 
L
A
 
T
I
 
I
D
|
D
E
 
E
F
 
F
P
 
P
V
 
V
V
 
L
S
 
L
V
 
I
A
 
A
A
 
A
A
 
A
F
 
V
A
 
A
E
 
Q
G
 
G
V
 
K
T
 
T
T
 
V
I
 
L
R
 
R
D
 
D
A
 
A
K
 
A
E
 
E
L
 
L
R
 
R
V
 
V
K
|
K
E
|
E
T
 
T
D
 
D
R
|
R
I
 
I
A
 
A
A
 
A
M
 
M
C
 
V
D
 
D
T
 
G
L
 
L
G
 
Q
K
 
K
I
 
L
G
 
G
A
 
I
Q
 
A
I
 
A
E
 
E
P
 
S
L
 
L
E
 
P
D
 
D
G
 
G
M
 
V
R
 
I
V
 
I
T
 
Q
G
 
G
G
 
G
K
 
-
S
 
T
L
 
L
S
 
E
G
 
G
G
 
G
T
 
E
V
 
V
N
 
N
S
 
S
F
 
Y
G
 
D
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
A
M
 
F
A
 
A
V
 
V
A
 
A
A
 
G
L
 
T
R
 
L
A
 
A
S
 
K
G
 
G
E
 
P
V
 
V
T
 
R
I
 
I
E
 
R
D
 
N
T
 
C
G
 
D
C
 
N
T
 
V
S
 
K
T
|
T
S
 
S
F
 
F
P
 
P
N
 
N
F
 
F
W
 
V
E
 
E
L
 
L
L
 
A
E
 
N
N
 
E
I
 
V

4egrA 2.50 angstrom resolution structure of 3-phosphoshikimate 1- carboxyvinyltransferase (aroa) from coxiella burnetii in complex with phosphoenolpyruvate
50% identity, 97% coverage: 11:430/432 of query aligns to 9:423/434 of 4egrA

query
sites
4egrA
P
 
P
V
 
S
T
 
Q
S
 
G
V
 
L
K
 
S
G
 
G
E
 
E
I
 
I
V
 
C
V
 
V
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
 
R
S
 
A
I
 
V
M
 
L
F
 
L
A
 
A
S
 
A
L
 
I
A
 
A
K
 
E
G
 
G
E
 
Q
S
 
T
R
 
Q
V
 
V
V
 
D
G
 
G
L
 
F
L
 
L
R
 
M
G
 
G
E
 
A
D
|
D
C
 
N
M
 
L
S
 
A
T
 
M
L
 
V
K
 
S
I
 
A
F
 
L
Q
 
Q
A
 
Q
M
 
M
G
 
G
V
 
A
E
 
S
V
 
I
E
 
Q
E
 
V
-
 
I
R
 
E
G
 
D
E
 
E
D
 
N
E
 
I
L
 
L
I
 
V
I
 
V
Q
 
E
G
 
G
R
 
V
G
 
G
I
 
M
D
 
T
G
 
G
L
 
L
L
 
Q
E
 
A
P
 
P
D
 
P
D
 
E
V
 
A
L
 
L
D
 
D
C
 
C
G
 
G
N
|
N
S
 
S
G
|
G
T
|
T
T
 
A
M
 
I
R
 
R
L
 
L
M
 
L
S
 
S
G
 
G
I
 
L
L
 
L
A
 
A
A
 
G
Q
 
Q
P
 
P
F
 
F
Y
 
N
S
 
T
V
 
V
M
 
L
T
 
T
G
 
G
D
 
D
Q
 
S
Y
 
S
L
 
L
R
 
Q
K
 
R
R
|
R
P
 
P
M
 
M
G
 
K
R
 
R
V
 
I
I
 
I
D
 
D
P
 
P
L
 
L
R
 
T
E
 
L
M
 
M
G
 
G
A
 
A
K
 
K
I
 
I
L
 
-
G
 
D
R
 
S
D
 
T
G
 
G
N
 
N
K
 
V
K
 
P
A
 
-
P
 
P
L
 
L
T
 
K
I
 
I
D
 
Y
G
 
G
G
 
N
G
 
P
-
 
R
L
 
L
K
 
T
P
 
G
A
 
I
E
 
H
Y
 
Y
H
 
Q
S
 
L
P
 
P
V
 
M
S
 
A
S
 
S
A
 
A
Q
 
Q
V
 
V
K
 
K
S
 
S
A
 
C
L
 
L
L
 
L
L
 
L
A
 
A
G
 
G
M
 
L
Q
 
Y
I
 
A
E
 
R
G
 
G
T
 
K
T
 
T
T
 
C
V
 
I
Y
 
T
E
 
E
P
 
P
H
 
A
L
 
P
S
 
S
R
 
R
D
 
D
H
 
H
S
 
T
E
 
E
R
 
R
M
 
L
L
 
L
C
 
K
Y
 
H
F
 
F
G
 
H
A
 
Y
E
 
T
V
 
L
E
 
Q
S
 
K
F
 
-
D
 
-
G
 
Q
G
 
S
A
 
I
R
 
C
V
 
V
T
 
S
G
 
G
P
 
G
V
 
G
V
 
K
L
 
L
E
 
K
G
 
A
R
 
N
E
 
D
V
 
I
F
 
S
V
 
I
P
 
P
G
 
G
D
 
D
I
 
I
S
 
S
S
 
S
A
 
A
A
 
A
F
 
F
F
 
F
L
 
I
V
 
V
A
 
A
G
 
A
L
 
T
I
 
I
V
 
T
P
 
P
D
 
G
S
 
S
E
 
A
L
 
I
L
 
R
L
 
L
K
 
C
N
 
R
V
 
V
G
 
G
V
 
V
N
 
N
P
 
P
T
 
T
R
 
R
S
 
L
G
 
G
I
 
V
I
 
I
D
 
N
I
 
L
L
 
L
Q
 
K
Q
 
M
M
 
M
G
 
G
G
 
A
S
 
D
I
 
I
E
 
E
L
 
V
L
 
T
N
 
H
Q
 
Y
R
 
T
E
 
E
L
 
-
S
 
-
G
 
K
E
 
E
P
 
P
V
 
T
A
 
A
D
 
D
L
 
I
L
 
T
V
 
V
K
 
R
S
 
H
S
 
A
Q
 
R
L
 
L
K
 
K
G
 
G
I
 
I
E
 
D
I
 
I
G
 
P
G
 
P
E
 
D
L
 
Q
V
 
V
P
 
P
R
 
L
A
 
T
I
 
I
D
|
D
E
 
E
F
 
F
P
 
P
V
 
V
V
 
L
S
 
L
V
 
I
A
 
A
A
 
A
A
 
A
F
 
V
A
 
A
E
 
Q
G
 
G
V
 
K
T
 
T
T
 
V
I
 
L
R
 
R
D
 
D
A
 
A
K
 
A
E
 
E
L
 
L
R
 
R
V
 
V
K
 
K
E
|
E
T
 
T
D
 
D
R
|
R
I
 
I
A
 
A
A
 
A
M
 
M
C
 
V
D
 
D
T
 
G
L
 
L
G
 
Q
K
 
K
I
 
L
G
 
G
A
 
I
Q
 
A
I
 
A
E
 
E
P
 
S
L
 
L
E
 
P
D
 
D
G
 
G
M
 
V
R
 
I
V
 
I
T
 
Q
G
 
G
G
 
G
K
 
-
S
 
T
L
 
L
S
 
E
G
 
G
G
 
G
T
 
E
V
 
V
N
 
N
S
 
S
F
 
Y
G
 
D
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
A
M
 
F
A
 
A
V
 
V
A
 
A
A
 
G
L
 
T
R
 
L
A
 
A
S
 
K
G
 
G
E
 
P
V
 
V
T
 
R
I
 
I
E
 
R
D
 
N
T
 
C
G
 
D
C
 
N
T
 
V
S
 
K
T
|
T
S
 
S
F
 
F
P
 
P
N
 
N
F
 
F
W
 
V
E
 
E
L
 
L
L
 
A
E
 
N
N
 
E
I
 
V

Q9R4E4 3-phosphoshikimate 1-carboxyvinyltransferase; 5-enolpyruvylshikimate-3-phosphate synthase; EPSP synthase; EPSPS; CP4 EPSP synthase; EC 2.5.1.19 from Agrobacterium sp. (strain CP4) (see paper)
47% identity, 97% coverage: 13:430/432 of query aligns to 16:443/455 of Q9R4E4

query
sites
Q9R4E4
T
 
S
S
 
G
V
 
L
K
 
S
G
 
G
E
 
T
I
 
V
V
 
R
V
 
I
P
 
P
G
 
G
D
 
D
K
 
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
S
I
 
F
M
 
M
F
 
F
A
 
G
S
 
G
L
 
L
A
 
A
K
 
S
G
 
G
E
 
E
S
 
T
R
 
R
V
 
I
V
 
T
G
 
G
L
 
L
L
 
L
R
 
E
G
 
G
E
 
E
D
 
D
C
 
V
M
 
I
S
 
N
T
 
T
L
 
G
K
 
K
I
 
A
F
 
M
Q
 
Q
A
 
A
M
 
M
G
 
G
V
 
A
E
 
R
V
 
I
E
 
R
E
 
K
R
 
E
G
 
G
E
 
-
D
 
D
E
 
T
L
 
W
I
 
I
I
 
I
Q
 
D
G
 
G
R
 
V
G
 
G
I
 
N
D
 
G
G
 
G
L
 
L
L
 
L
E
 
A
P
 
P
D
 
E
D
 
A
V
 
P
L
 
L
D
 
D
C
 
F
G
 
G
N
 
N
S
 
A
G
x
A
T
 
T
T
 
G
M
 
C
R
 
R
L
 
L
M
 
T
S
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
Y
 
D
S
 
S
V
 
T
M
 
F
T
 
I
G
 
G
D
 
D
Q
 
A
Y
 
S
L
 
L
R
 
T
K
 
K
R
 
R
P
 
P
M
 
M
G
 
G
R
 
R
V
 
V
I
 
L
D
 
N
P
 
P
L
 
L
R
 
R
E
 
E
M
 
M
G
 
G
A
 
V
K
 
Q
I
 
V
L
 
K
G
 
S
R
 
E
D
 
D
G
 
G
N
 
D
K
 
R
K
 
-
A
 
L
P
 
P
L
 
V
T
 
T
I
 
L
D
 
R
G
 
G
G
 
P
G
 
K
L
 
T
-
 
P
K
 
T
P
 
P
A
 
I
E
 
T
Y
 
Y
H
 
R
S
 
V
P
 
P
V
 
M
S
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
A
L
 
V
L
 
L
L
 
L
A
 
A
G
 
G
M
 
L
Q
 
N
I
 
T
E
 
P
G
 
G
T
 
I
T
 
T
T
 
T
V
 
V
Y
 
I
E
 
E
P
 
P
H
 
I
L
 
M
S
 
T
R
 
R
D
 
D
H
 
H
S
 
T
E
 
E
R
 
K
M
 
M
L
 
L
C
 
Q
Y
 
G
F
 
F
G
 
G
A
 
A
E
 
N
-
 
L
-
 
T
V
 
V
E
 
E
S
 
T
F
 
D
D
 
A
G
 
D
G
 
G
A
 
V
R
 
R
-
 
T
-
 
I
-
 
R
V
 
L
T
 
E
G
 
G
P
 
R
V
 
G
V
 
K
L
 
L
E
 
T
G
 
G
R
 
Q
E
 
V
V
 
I
F
 
D
V
 
V
P
 
P
G
 
G
D
 
D
I
 
P
S
 
S
S
 
S
A
 
T
A
 
A
F
 
F
F
 
P
L
 
L
V
 
V
A
 
A
G
 
A
L
 
L
I
 
L
V
 
V
P
 
P
D
 
G
S
 
S
E
 
D
L
 
V
L
 
T
L
 
I
K
 
L
N
 
N
V
 
V
G
 
L
V
 
M
N
 
N
P
 
P
T
 
T
R
 
R
S
 
T
G
 
G
I
 
L
I
 
I
D
 
L
I
 
T
L
 
L
Q
 
Q
Q
 
E
M
 
M
G
 
G
G
 
A
S
 
D
I
 
I
E
 
E
L
 
V
L
 
I
N
 
N
Q
 
P
R
 
R
E
 
L
L
 
A
S
 
G
G
 
G
E
 
E
P
 
D
V
 
V
A
 
A
D
 
D
L
 
L
L
 
R
V
 
V
K
 
R
S
 
S
S
 
S
Q
 
T
L
 
L
K
 
K
G
 
G
I
 
V
E
 
T
I
 
V
G
 
P
G
 
E
E
 
D
L
 
R
V
 
A
P
 
P
R
 
S
A
 
M
I
 
I
D
|
D
E
 
E
F
 
Y
P
 
P
V
 
I
V
 
L
S
 
A
V
 
V
A
 
A
A
 
A
A
 
A
F
 
F
A
 
A
E
 
E
G
 
G
V
 
A
T
 
T
T
 
V
I
 
M
R
 
N
D
 
G
A
 
L
K
 
E
E
 
E
L
 
L
R
 
R
V
 
V
K
|
K
E
 
E
T
 
S
D
 
D
R
 
R
I
 
L
A
 
S
A
 
A
M
 
V
C
 
A
D
 
N
T
 
G
L
 
L
G
 
K
K
 
L
I
 
N
G
 
G
A
 
V
Q
 
D
I
 
C
E
 
D
P
 
E
L
 
G
E
 
E
D
 
T
G
 
S
M
 
L
R
 
V
V
 
V
T
 
R
G
 
G
-
 
R
-
 
P
-
 
D
G
 
G
K
 
K
S
 
G
L
 
L
-
 
G
-
 
N
-
 
A
S
 
S
G
 
G
G
 
A
T
 
A
V
 
V
N
 
A
S
 
T
F
 
H
G
 
L
D
 
D
H
 
H
R
 
R
I
 
I
A
 
A
M
 
M
S
 
S
M
 
F
A
 
L
V
 
V
A
 
M
A
 
G
L
 
L
R
 
V
A
 
S
S
 
E
G
 
N
E
 
P
V
 
V
T
 
T
I
 
V
E
 
D
D
 
D
T
 
A
G
 
T
C
 
M
T
 
I
S
 
A
T
 
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
W
 
M
E
 
D
L
 
L
L
 
M
E
 
A
N
 
G
I
 
L

2pqcA Cp4 epsps liganded with (r)-phosphonate tetrahedral reaction intermediate analog (see paper)
47% identity, 97% coverage: 13:430/432 of query aligns to 11:438/445 of 2pqcA

query
sites
2pqcA
T
 
S
S
 
G
V
 
L
K
 
S
G
 
G
E
 
T
I
 
V
V
 
R
V
 
I
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
S
I
 
F
M
 
M
F
 
F
A
 
G
S
 
G
L
 
L
A
 
A
K
 
S
G
 
G
E
 
E
S
 
T
R
 
R
V
 
I
V
 
T
G
 
G
L
 
L
L
 
L
R
 
E
G
 
G
E
 
E
D
|
D
C
 
V
M
 
I
S
 
N
T
 
T
L
 
G
K
 
K
I
 
A
F
 
M
Q
 
Q
A
 
A
M
 
M
G
 
G
V
 
A
E
 
R
V
 
I
E
 
R
E
 
K
R
 
E
G
 
G
E
 
-
D
 
D
E
 
T
L
 
W
I
 
I
I
 
I
Q
 
D
G
 
G
R
 
V
G
 
G
I
 
N
D
 
G
G
 
G
L
 
L
L
 
L
E
 
A
P
 
P
D
 
E
D
 
A
V
 
P
L
 
L
D
 
D
C
 
F
G
 
G
N
|
N
S
 
A
G
 
A
T
|
T
T
 
G
M
 
C
R
 
R
L
 
L
M
 
T
S
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
Y
 
D
S
 
S
V
 
T
M
 
F
T
 
I
G
 
G
D
 
D
Q
 
A
Y
 
S
L
 
L
R
 
T
K
 
K
R
|
R
P
 
P
M
 
M
G
 
G
R
 
R
V
 
V
I
 
L
D
 
N
P
 
P
L
 
L
R
 
R
E
 
E
M
 
M
G
 
G
A
 
V
K
 
Q
I
 
V
L
 
K
G
 
S
R
 
E
D
 
D
G
 
G
N
 
D
K
 
R
K
 
-
A
 
L
P
 
P
L
 
V
T
 
T
I
 
L
D
 
R
G
 
G
G
 
P
G
 
K
L
 
T
-
 
P
K
 
T
P
 
P
A
 
I
E
 
T
Y
 
Y
H
 
R
S
 
V
P
 
P
V
 
M
S
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
A
L
 
V
L
 
L
L
 
L
A
 
A
G
 
G
M
 
L
Q
 
N
I
 
T
E
 
P
G
 
G
T
 
I
T
 
T
T
 
T
V
 
V
Y
 
I
E
 
E
P
 
P
H
 
I
L
 
M
S
 
T
R
 
R
D
 
D
H
 
H
S
 
T
E
 
E
R
 
K
M
 
M
L
 
L
C
 
Q
Y
 
G
F
 
F
G
 
G
A
 
A
E
 
N
-
 
L
-
 
T
V
 
V
E
 
E
S
 
T
F
 
D
D
 
A
G
 
D
G
 
G
A
 
V
R
 
R
-
 
T
-
 
I
-
 
R
V
 
L
T
 
E
G
 
G
P
 
R
V
 
G
V
 
K
L
 
L
E
 
T
G
 
G
R
 
Q
E
 
V
V
 
I
F
 
D
V
 
V
P
 
P
G
 
G
D
 
D
I
 
P
S
 
S
S
 
S
A
 
T
A
 
A
F
 
F
F
 
P
L
 
L
V
 
V
A
 
A
G
 
A
L
 
L
I
 
L
V
 
V
P
 
P
D
 
G
S
 
S
E
 
D
L
 
V
L
 
T
L
 
I
K
 
L
N
 
N
V
 
V
G
 
L
V
 
M
N
 
N
P
 
P
T
 
T
R
 
R
S
 
T
G
 
G
I
 
L
I
 
I
D
 
L
I
 
T
L
 
L
Q
 
Q
Q
 
E
M
 
M
G
 
G
G
 
A
S
 
D
I
 
I
E
 
E
L
 
V
L
 
I
N
 
N
Q
 
P
R
 
R
E
 
L
L
 
A
S
 
G
G
 
G
E
 
E
P
 
D
V
 
V
A
 
A
D
 
D
L
 
L
L
 
R
V
 
V
K
 
R
S
 
S
S
 
S
Q
 
T
L
 
L
K
 
K
G
 
G
I
 
V
E
 
T
I
 
V
G
 
P
G
 
E
E
 
D
L
 
R
V
 
A
P
 
P
R
 
S
A
 
M
I
 
I
D
|
D
E
 
E
F
 
Y
P
 
P
V
 
I
V
 
L
S
 
A
V
 
V
A
 
A
A
 
A
A
 
A
F
 
F
A
 
A
E
 
E
G
 
G
V
 
A
T
 
T
T
 
V
I
 
M
R
 
N
D
 
G
A
 
L
K
 
E
E
 
E
L
 
L
R
 
R
V
 
V
K
|
K
E
|
E
T
 
S
D
 
D
R
|
R
I
 
L
A
 
S
A
 
A
M
 
V
C
 
A
D
 
N
T
 
G
L
 
L
G
 
K
K
 
L
I
 
N
G
 
G
A
 
V
Q
 
D
I
 
C
E
 
D
P
 
E
L
 
G
E
 
E
D
 
T
G
 
S
M
 
L
R
 
V
V
 
V
T
 
R
G
 
G
-
 
R
-
 
P
-
 
D
G
 
G
K
 
K
S
 
G
L
 
L
-
 
G
-
 
N
-
 
A
S
 
S
G
 
G
G
 
A
T
 
A
V
 
V
N
 
A
S
 
T
F
 
H
G
 
L
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
S
M
 
F
A
 
L
V
 
V
A
 
M
A
 
G
L
 
L
R
 
V
A
 
S
S
 
E
G
 
N
E
 
P
V
 
V
T
 
T
I
 
V
E
 
D
D
 
D
T
 
A
G
 
T
C
 
M
T
 
I
S
 
A
T
|
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
W
 
M
E
 
D
L
 
L
L
 
M
E
 
A
N
 
G
I
 
L

2pqbA Cp4 epsps liganded with (r)-difluoromethyl tetrahedral intermediate analog (see paper)
47% identity, 97% coverage: 13:430/432 of query aligns to 11:438/445 of 2pqbA

query
sites
2pqbA
T
 
S
S
 
G
V
 
L
K
 
S
G
 
G
E
 
T
I
 
V
V
 
R
V
 
I
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
S
I
 
F
M
 
M
F
 
F
A
 
G
S
 
G
L
 
L
A
 
A
K
 
S
G
 
G
E
 
E
S
 
T
R
 
R
V
 
I
V
 
T
G
 
G
L
 
L
L
 
L
R
 
E
G
 
G
E
 
E
D
|
D
C
 
V
M
 
I
S
 
N
T
 
T
L
 
G
K
 
K
I
 
A
F
 
M
Q
 
Q
A
 
A
M
 
M
G
 
G
V
 
A
E
 
R
V
 
I
E
 
R
E
 
K
R
 
E
G
 
G
E
 
-
D
 
D
E
 
T
L
 
W
I
 
I
I
 
I
Q
 
D
G
 
G
R
 
V
G
 
G
I
 
N
D
 
G
G
 
G
L
 
L
L
 
L
E
 
A
P
 
P
D
 
E
D
 
A
V
 
P
L
 
L
D
 
D
C
 
F
G
 
G
N
|
N
S
 
A
G
x
A
T
|
T
T
 
G
M
 
C
R
 
R
L
 
L
M
 
T
S
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
Y
 
D
S
 
S
V
 
T
M
 
F
T
 
I
G
 
G
D
 
D
Q
 
A
Y
 
S
L
 
L
R
 
T
K
 
K
R
|
R
P
 
P
M
 
M
G
 
G
R
 
R
V
 
V
I
 
L
D
 
N
P
 
P
L
 
L
R
 
R
E
 
E
M
 
M
G
 
G
A
 
V
K
 
Q
I
 
V
L
 
K
G
 
S
R
 
E
D
 
D
G
 
G
N
 
D
K
 
R
K
 
-
A
 
L
P
 
P
L
 
V
T
 
T
I
 
L
D
 
R
G
 
G
G
 
P
G
 
K
L
 
T
-
 
P
K
 
T
P
 
P
A
 
I
E
 
T
Y
 
Y
H
 
R
S
 
V
P
 
P
V
 
M
S
 
A
S
|
S
A
 
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
A
L
 
V
L
 
L
L
 
L
A
 
A
G
 
G
M
 
L
Q
 
N
I
 
T
E
 
P
G
 
G
T
 
I
T
 
T
T
 
T
V
 
V
Y
 
I
E
 
E
P
 
P
H
 
I
L
 
M
S
 
T
R
 
R
D
 
D
H
 
H
S
 
T
E
 
E
R
 
K
M
 
M
L
 
L
C
 
Q
Y
 
G
F
 
F
G
 
G
A
 
A
E
 
N
-
 
L
-
 
T
V
 
V
E
 
E
S
 
T
F
 
D
D
 
A
G
 
D
G
 
G
A
 
V
R
 
R
-
 
T
-
 
I
-
 
R
V
 
L
T
 
E
G
 
G
P
 
R
V
 
G
V
 
K
L
 
L
E
 
T
G
 
G
R
 
Q
E
 
V
V
 
I
F
 
D
V
 
V
P
 
P
G
 
G
D
 
D
I
 
P
S
 
S
S
 
S
A
 
T
A
 
A
F
 
F
F
 
P
L
 
L
V
 
V
A
 
A
G
 
A
L
 
L
I
 
L
V
 
V
P
 
P
D
 
G
S
 
S
E
 
D
L
 
V
L
 
T
L
 
I
K
 
L
N
 
N
V
 
V
G
 
L
V
 
M
N
 
N
P
 
P
T
 
T
R
 
R
S
 
T
G
 
G
I
 
L
I
 
I
D
 
L
I
 
T
L
 
L
Q
 
Q
Q
 
E
M
 
M
G
 
G
G
 
A
S
 
D
I
 
I
E
 
E
L
 
V
L
 
I
N
 
N
Q
 
P
R
 
R
E
 
L
L
 
A
S
 
G
G
 
G
E
 
E
P
 
D
V
 
V
A
 
A
D
 
D
L
 
L
L
 
R
V
 
V
K
 
R
S
 
S
S
 
S
Q
 
T
L
 
L
K
 
K
G
 
G
I
 
V
E
 
T
I
 
V
G
 
P
G
 
E
E
 
D
L
 
R
V
 
A
P
 
P
R
 
S
A
 
M
I
 
I
D
|
D
E
 
E
F
 
Y
P
 
P
V
 
I
V
 
L
S
 
A
V
 
V
A
 
A
A
 
A
A
 
A
F
 
F
A
 
A
E
 
E
G
 
G
V
 
A
T
 
T
T
 
V
I
 
M
R
 
N
D
 
G
A
 
L
K
 
E
E
 
E
L
 
L
R
 
R
V
 
V
K
|
K
E
|
E
T
 
S
D
 
D
R
|
R
I
 
L
A
 
S
A
 
A
M
 
V
C
 
A
D
 
N
T
 
G
L
 
L
G
 
K
K
 
L
I
 
N
G
 
G
A
 
V
Q
 
D
I
 
C
E
 
D
P
 
E
L
 
G
E
 
E
D
 
T
G
 
S
M
 
L
R
 
V
V
 
V
T
 
R
G
 
G
-
 
R
-
 
P
-
 
D
G
 
G
K
 
K
S
 
G
L
 
L
-
 
G
-
 
N
-
 
A
S
 
S
G
 
G
G
 
A
T
 
A
V
 
V
N
 
A
S
 
T
F
 
H
G
 
L
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
S
M
 
F
A
 
L
V
 
V
A
 
M
A
 
G
L
 
L
R
 
V
A
 
S
S
 
E
G
 
N
E
 
P
V
 
V
T
 
T
I
 
V
E
 
D
D
 
D
T
 
A
G
 
T
C
 
M
T
 
I
S
 
A
T
|
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
W
 
M
E
 
D
L
 
L
L
 
M
E
 
A
N
 
G
I
 
L

2ggaA Cp4 epsp synthase liganded with s3p and glyphosate (see paper)
47% identity, 97% coverage: 13:430/432 of query aligns to 11:438/445 of 2ggaA

query
sites
2ggaA
T
 
S
S
 
G
V
 
L
K
 
S
G
 
G
E
 
T
I
 
V
V
 
R
V
 
I
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
S
I
 
F
M
 
M
F
 
F
A
 
G
S
 
G
L
 
L
A
 
A
K
 
S
G
 
G
E
 
E
S
 
T
R
 
R
V
 
I
V
 
T
G
 
G
L
 
L
L
 
L
R
 
E
G
 
G
E
 
E
D
|
D
C
 
V
M
 
I
S
 
N
T
 
T
L
 
G
K
 
K
I
 
A
F
 
M
Q
 
Q
A
 
A
M
 
M
G
 
G
V
 
A
E
 
R
V
 
I
E
 
R
E
 
K
R
 
E
G
 
G
E
 
-
D
 
D
E
 
T
L
 
W
I
 
I
I
 
I
Q
 
D
G
 
G
R
 
V
G
 
G
I
 
N
D
 
G
G
 
G
L
 
L
L
 
L
E
 
A
P
 
P
D
 
E
D
 
A
V
 
P
L
 
L
D
 
D
C
 
F
G
 
G
N
|
N
S
x
A
G
x
A
T
|
T
T
 
G
M
 
C
R
 
R
L
 
L
M
 
T
S
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A
 
V
Q
 
Y
P
 
D
F
 
F
Y
 
D
S
 
S
V
 
T
M
 
F
T
 
I
G
 
G
D
 
D
Q
 
A
Y
 
S
L
 
L
R
 
T
K
 
K
R
|
R
P
 
P
M
 
M
G
 
G
R
 
R
V
 
V
I
 
L
D
 
N
P
 
P
L
 
L
R
 
R
E
 
E
M
 
M
G
 
G
A
 
V
K
 
Q
I
 
V
L
 
K
G
 
S
R
 
E
D
 
D
G
 
G
N
 
D
K
 
R
K
 
-
A
 
L
P
 
P
L
 
V
T
 
T
I
 
L
D
 
R
G
 
G
G
 
P
G
 
K
L
 
T
-
 
P
K
 
T
P
 
P
A
 
I
E
 
T
Y
 
Y
H
 
R
S
 
V
P
 
P
V
 
M
S
 
A
S
|
S
A
|
A
Q
|
Q
V
 
V
K
 
K
S
 
S
A
 
A
L
 
V
L
 
L
L
 
L
A
 
A
G
 
G
M
 
L
Q
 
N
I
 
T
E
 
P
G
 
G
T
 
I
T
 
T
T
 
T
V
 
V
Y
 
I
E
 
E
P
 
P
H
 
I
L
 
M
S
 
T
R
|
R
D
 
D
H
 
H
S
 
T
E
 
E
R
 
K
M
 
M
L
 
L
C
 
Q
Y
 
G
F
 
F
G
 
G
A
 
A
E
 
N
-
 
L
-
 
T
V
 
V
E
 
E
S
 
T
F
 
D
D
 
A
G
 
D
G
 
G
A
 
V
R
 
R
-
 
T
-
 
I
-
 
R
V
 
L
T
 
E
G
 
G
P
 
R
V
 
G
V
 
K
L
 
L
E
 
T
G
 
G
R
 
Q
E
 
V
V
 
I
F
 
D
V
 
V
P
 
P
G
 
G
D
 
D
I
 
P
S
 
S
S
 
S
A
 
T
A
 
A
F
 
F
F
 
P
L
 
L
V
 
V
A
 
A
G
 
A
L
 
L
I
 
L
V
 
V
P
 
P
D
 
G
S
 
S
E
 
D
L
 
V
L
 
T
L
 
I
K
 
L
N
 
N
V
 
V
G
 
L
V
 
M
N
 
N
P
 
P
T
 
T
R
 
R
S
 
T
G
 
G
I
 
L
I
 
I
D
 
L
I
 
T
L
 
L
Q
 
Q
Q
 
E
M
 
M
G
 
G
G
 
A
S
 
D
I
 
I
E
 
E
L
 
V
L
 
I
N
 
N
Q
 
P
R
 
R
E
 
L
L
 
A
S
 
G
G
 
G
E
 
E
P
 
D
V
 
V
A
 
A
D
 
D
L
 
L
L
 
R
V
 
V
K
 
R
S
 
S
S
 
S
Q
 
T
L
 
L
K
 
K
G
 
G
I
 
V
E
 
T
I
 
V
G
 
P
G
 
E
E
 
D
L
 
R
V
 
A
P
 
P
R
 
S
A
 
M
I
 
I
D
|
D
E
 
E
F
 
Y
P
 
P
V
 
I
V
 
L
S
 
A
V
 
V
A
 
A
A
 
A
A
 
A
F
 
F
A
 
A
E
 
E
G
 
G
V
 
A
T
 
T
T
 
V
I
 
M
R
 
N
D
 
G
A
 
L
K
 
E
E
 
E
L
 
L
R
 
R
V
 
V
K
|
K
E
|
E
T
 
S
D
 
D
R
|
R
I
 
L
A
 
S
A
 
A
M
 
V
C
 
A
D
 
N
T
 
G
L
 
L
G
 
K
K
 
L
I
 
N
G
 
G
A
 
V
Q
 
D
I
 
C
E
 
D
P
 
E
L
 
G
E
 
E
D
 
T
G
 
S
M
 
L
R
 
V
V
 
V
T
 
R
G
 
G
-
 
R
-
 
P
-
 
D
G
 
G
K
 
K
S
 
G
L
 
L
-
 
G
-
 
N
-
 
A
S
 
S
G
 
G
G
 
A
T
 
A
V
 
V
N
 
A
S
 
T
F
 
H
G
 
L
D
 
D
H
|
H
R
|
R
I
 
I
A
 
A
M
 
M
S
 
S
M
 
F
A
 
L
V
 
V
A
 
M
A
 
G
L
 
L
R
 
V
A
 
S
S
 
E
G
 
N
E
 
P
V
 
V
T
 
T
I
 
V
E
 
D
D
 
D
T
 
A
G
 
T
C
 
M
T
 
I
S
 
A
T
|
T
S
 
S
F
 
F
P
 
P
N
 
E
F
 
F
W
 
M
E
 
D
L
 
L
L
 
M
E
 
A
N
 
G
I
 
L

2gg6A Cp4 epsp synthase liganded with s3p (see paper)
47% identity, 97% coverage: 13:430/432 of query aligns to 11:438/445 of 2gg6A

query
sites
2gg6A
T
 
S
S
 
G
V
 
L
K
 
S
G
 
G
E
 
T
I
 
V
V
 
R
V
 
I
P
 
P
G
 
G
D
 
D
K
|
K
S
|
S
I
 
I
S
 
S
H
 
H
R
|
R
S
 
S
I
 
F
M
 
M
F
 
F
A
 
G
S
 
G
L
 
L
A
 
A
K
 
S
G
 
G
E
 
E
S
 
T
R
 
R
V
 
I
V
 
T
G
 
G
L
 
L
L
 
L
R
 
E
G
 
G
E
 
E
D
|
D
C
 
V
M
 
I
S
 
N
T
 
T
L
 
G
K
 
K
I
 
A
F
 
M
Q
 
Q
A
 
A
M
 
M
G
 
G
V
 
A
E
 
R
V
 
I
E
 
R
E
 
K
R
 
E
G
 
G
E
 
-
D
 
D
E
 
T
L
 
W
I
 
I
I
 
I
Q
 
D
G
 
G
R
 
V
G
 
G
I
 
N
D
 
G
G
 
G
L
 
L
L
 
L
E
 
A
P
 
P
D
 
E
D
 
A
V
 
P
L
 
L
D
 
D
C
 
F
G
 
G
N
|
N
S
 
A
G
 
A
T
|
T
T
 
G
M
 
C
R
 
R
L
 
L
M
 
T
S
 
M
G
 
G
I
 
L
L
 
V
A
 
G
A</