SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_017600183.1 NCBI__GCF_000341125.1:WP_017600183.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

3t44A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with indole glycerol phosphate (igp) amd anthranilate
66% identity, 96% coverage: 2:259/268 of query aligns to 1:258/259 of 3t44A

query
sites
3t44A
S
 
T
V
 
V
L
 
L
D
 
D
E
 
S
I
 
I
L
 
L
D
 
E
G
 
G
V
 
V
R
 
R
A
 
A
D
 
D
L
 
V
A
 
A
R
 
A
R
 
R
Q
 
E
E
 
A
A
 
S
L
 
V
P
 
S
L
 
L
D
 
S
R
 
E
L
 
I
K
 
K
A
 
A
Q
 
A
A
 
A
E
 
A
S
 
A
V
 
A
P
 
P
T
 
P
P
 
P
Q
 
L
D
 
D
A
 
V
E
 
M
A
 
A
A
 
A
L
 
L
R
 
R
R
 
E
P
 
P
G
 
G
V
 
I
H
 
G
V
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
R
 
R
A
 
A
S
|
S
P
|
P
S
|
S
K
 
A
G
 
G
P
 
A
L
 
L
A
 
A
T
 
T
I
 
I
A
 
A
D
 
D
P
 
P
A
 
A
A
 
K
L
 
L
A
 
A
R
 
Q
D
 
A
Y
 
Y
E
 
Q
A
 
D
G
 
G
G
 
G
A
 
A
T
 
R
W
 
I
I
 
V
S
 
S
V
 
V
L
 
V
T
 
T
E
 
E
E
 
Q
R
 
R
R
 
R
F
|
F
N
 
Q
G
 
G
S
 
S
L
 
L
A
 
D
D
 
D
L
 
L
E
 
D
A
 
A
V
 
V
H
 
R
K
 
A
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
V
L
 
L
R
 
R
K
|
K
D
 
D
F
|
F
V
 
V
V
 
V
S
 
Q
S
 
P
Y
 
Y
Q
 
Q
L
 
I
W
 
H
E
 
E
A
 
A
R
 
R
V
 
A
H
 
H
G
 
G
A
 
A
S
 
D
A
 
M
I
 
L
L
 
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
A
L
 
L
P
 
E
Q
 
Q
E
 
S
A
 
V
L
 
L
V
 
V
S
 
S
L
 
M
V
 
L
E
 
D
R
 
R
A
 
T
R
 
E
S
 
S
L
 
L
G
 
G
L
 
M
T
 
T
P
 
A
L
 
L
V
 
V
E
|
E
V
 
V
H
 
H
D
 
T
E
 
E
D
 
Q
E
 
E
V
 
A
T
 
D
R
 
R
A
 
A
L
 
L
D
 
K
A
 
A
G
 
G
A
 
A
T
 
K
V
 
V
I
 
I
G
 
G
V
 
V
N
|
N
A
 
A
R
|
R
N
 
D
L
|
L
K
 
M
T
 
T
L
 
L
E
 
D
V
 
V
D
 
D
R
 
R
D
 
D
T
 
C
F
 
F
A
 
A
R
 
R
L
 
I
A
 
A
P
 
P
L
 
G
I
 
L
P
 
P
A
 
S
D
 
S
R
 
V
V
 
I
K
 
R
I
 
I
A
 
A
E
|
E
S
|
S
G
 
G
V
 
V
R
 
R
G
 
G
P
 
T
H
 
A
D
 
D
L
 
L
L
 
L
A
 
A
Y
 
Y
A
 
A
G
 
G
A
 
A
G
 
G
A
 
A
G
 
D
A
 
A
V
 
V
L
|
L
V
|
V
G
|
G
E
|
E
S
 
G
L
 
L
V
 
V
R
 
T
G
 
S
G
 
G
N
 
D
P
 
P
R
 
R
E
 
A
A
 
A
V
 
V
A
 
A
D
 
D
L
 
L
V
 
V
T
 
T
A
 
A
G
 
G

3t55A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with phenoxymethyl benzoic acid (pmba)
66% identity, 96% coverage: 2:259/268 of query aligns to 1:258/258 of 3t55A

query
sites
3t55A
S
 
T
V
 
V
L
 
L
D
 
D
E
 
S
I
 
I
L
 
L
D
 
E
G
 
G
V
 
V
R
 
R
A
 
A
D
 
D
L
 
V
A
 
A
R
 
A
R
 
R
Q
 
E
E
 
A
A
 
S
L
 
V
P
 
S
L
 
L
D
 
S
R
 
E
L
 
I
K
 
K
A
 
A
Q
 
A
A
 
A
E
 
A
S
 
A
V
 
A
P
 
P
T
 
P
P
 
P
Q
 
L
D
 
D
A
 
V
E
 
M
A
 
A
A
 
A
L
 
L
R
 
R
R
 
E
P
 
P
G
 
G
V
 
I
H
 
G
V
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
R
 
R
A
 
A
S
|
S
P
|
P
S
|
S
K
 
A
G
 
G
P
 
A
L
 
L
A
 
A
T
 
T
I
 
I
A
 
A
D
 
D
P
 
P
A
 
A
A
 
K
L
 
L
A
 
A
R
 
Q
D
 
A
Y
 
Y
E
 
Q
A
 
D
G
 
G
G
 
G
A
 
A
T
 
R
W
 
I
I
 
V
S
 
S
V
 
V
L
 
V
T
 
T
E
 
E
E
 
Q
R
 
R
R
 
R
F
|
F
N
 
Q
G
 
G
S
 
S
L
 
L
A
 
D
D
 
D
L
 
L
E
 
D
A
 
A
V
 
V
H
 
R
K
 
A
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
V
L
 
L
R
 
R
K
|
K
D
|
D
F
|
F
V
 
V
V
 
V
S
 
Q
S
 
P
Y
 
Y
Q
 
Q
L
 
I
W
 
H
E
 
E
A
 
A
R
 
R
V
 
A
H
 
H
G
 
G
A
 
A
S
 
D
A
 
M
I
 
L
L
|
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
A
L
 
L
P
 
E
Q
 
Q
E
 
S
A
 
V
L
 
L
V
 
V
S
 
S
L
 
M
V
 
L
E
 
D
R
 
R
A
 
T
R
 
E
S
 
S
L
 
L
G
 
G
L
 
M
T
 
T
P
 
A
L
 
L
V
 
V
E
|
E
V
 
V
H
 
H
D
 
T
E
 
E
D
 
Q
E
 
E
V
 
A
T
 
D
R
 
R
A
 
A
L
 
L
D
 
K
A
 
A
G
 
G
A
 
A
T
 
K
V
 
V
I
 
I
G
 
G
V
 
V
N
|
N
A
 
A
R
|
R
N
 
D
L
|
L
K
 
M
T
 
T
L
|
L
E
 
D
V
 
V
D
 
D
R
 
R
D
 
D
T
 
C
F
 
F
A
 
A
R
 
R
L
 
I
A
 
A
P
 
P
L
 
G
I
 
L
P
 
P
A
 
S
D
 
S
R
 
V
V
 
I
K
 
R
I
 
I
A
 
A
E
|
E
S
|
S
G
 
G
V
 
V
R
 
R
G
 
G
P
 
T
H
 
A
D
 
D
L
 
L
L
 
L
A
 
A
Y
 
Y
A
 
A
G
 
G
A
 
A
G
 
G
A
 
A
G
 
D
A
 
A
V
 
V
L
 
L
V
 
V
G
 
G
E
 
E
S
 
G
L
 
L
V
 
V
R
 
T
G
 
S
G
 
G
N
 
D
P
 
P
R
 
R
E
 
A
A
 
A
V
 
V
A
 
A
D
 
D
L
 
L
V
 
V
T
 
T
A
 
A
G
 
G

3t78A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with 5-fluoroanthranilate
65% identity, 96% coverage: 2:259/268 of query aligns to 1:256/257 of 3t78A

query
sites
3t78A
S
 
T
V
 
V
L
 
L
D
 
D
E
 
S
I
 
I
L
 
L
D
 
E
G
 
G
V
 
V
R
 
R
A
 
A
D
 
D
L
 
V
A
 
A
R
 
A
R
 
R
Q
 
E
E
 
A
A
 
S
L
 
V
P
 
S
L
 
L
D
 
S
R
 
E
L
 
I
K
 
K
A
 
A
Q
 
A
A
 
A
E
 
A
S
 
A
V
 
A
P
 
P
T
 
P
P
 
P
Q
 
L
D
 
D
A
 
V
E
 
M
A
 
A
A
 
A
L
 
L
R
 
R
R
 
E
P
 
P
G
 
G
V
 
I
H
 
G
V
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
R
 
R
A
 
A
S
|
S
P
|
P
S
|
S
K
 
A
G
 
G
P
 
A
L
 
L
A
 
A
T
 
T
I
 
I
A
 
A
D
 
D
P
 
P
A
 
A
A
 
K
L
 
L
A
 
A
R
 
Q
D
 
A
Y
 
Y
E
 
Q
A
 
D
G
 
G
G
 
G
A
 
A
T
 
R
W
 
I
I
 
V
S
 
S
V
 
V
L
 
V
T
 
T
E
 
E
E
 
Q
R
 
R
R
 
R
F
|
F
N
 
Q
G
 
G
S
 
S
L
 
L
A
 
D
D
 
D
L
 
L
E
 
D
A
 
A
V
 
V
H
 
R
K
 
A
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
V
L
 
L
R
 
R
K
|
K
D
 
D
F
|
F
V
 
V
V
 
V
S
 
Q
S
 
P
Y
 
Y
Q
 
Q
L
 
I
W
 
H
E
 
E
A
 
A
R
 
R
V
 
A
H
 
H
G
 
G
A
 
A
S
 
D
A
 
M
I
 
L
L
 
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
A
L
 
L
P
 
E
Q
 
Q
E
 
S
A
 
V
L
 
L
V
 
V
S
 
S
L
 
M
V
 
L
E
 
D
R
 
R
A
 
T
R
 
E
S
 
S
L
 
L
G
 
G
L
 
M
T
 
T
P
 
A
L
 
L
V
 
V
E
|
E
V
 
V
H
 
H
D
 
T
E
 
E
D
 
Q
E
 
E
V
 
A
T
 
D
R
 
R
A
 
A
L
 
L
D
 
K
A
 
A
G
 
G
A
 
A
T
 
K
V
 
V
I
 
I
G
 
G
V
 
V
N
|
N
A
 
A
R
|
R
N
 
D
L
|
L
K
 
M
T
 
T
L
 
L
E
 
-
V
 
-
D
 
D
R
 
R
D
 
D
T
 
C
F
 
F
A
 
A
R
 
R
L
 
I
A
 
A
P
 
P
L
 
G
I
 
L
P
 
P
A
 
S
D
 
S
R
 
V
V
 
I
K
 
R
I
 
I
A
 
A
E
|
E
S
|
S
G
 
G
V
 
V
R
 
R
G
 
G
P
 
T
H
 
A
D
 
D
L
 
L
L
 
L
A
 
A
Y
 
Y
A
 
A
G
 
G
A
 
A
G
 
G
A
 
A
G
 
D
A
 
A
V
 
V
L
 
L
V
 
V
G
 
G
E
 
E
S
 
G
L
 
L
V
 
V
R
 
T
G
 
S
G
 
G
N
 
D
P
 
P
R
 
R
E
 
A
A
 
A
V
 
V
A
 
A
D
 
D
L
 
L
V
 
V
T
 
T
A
 
A
G
 
G

3t40A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) complex with n-2-carboxyphenyl glycine (cpg)
61% identity, 98% coverage: 2:264/268 of query aligns to 1:249/251 of 3t40A

query
sites
3t40A
S
 
T
V
 
V
L
 
L
D
 
D
E
 
S
I
 
I
L
 
L
D
 
E
G
 
G
V
 
V
R
 
R
A
 
A
D
 
D
L
 
V
A
 
A
R
 
A
R
 
R
Q
 
E
E
 
A
A
 
S
L
 
V
P
 
S
L
 
L
D
 
S
R
 
E
L
 
I
K
 
K
A
 
A
Q
 
A
A
 
A
E
 
A
S
 
A
V
 
A
P
 
P
T
 
P
P
 
P
Q
 
L
D
 
D
A
 
V
E
 
M
A
 
A
A
 
A
L
 
L
R
 
R
R
 
E
P
 
P
G
 
G
V
 
I
H
 
G
V
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
R
 
R
A
 
-
S
 
-
P
 
-
S
 
-
K
 
-
G
 
-
P
 
-
L
 
-
A
 
-
T
 
T
I
 
I
A
 
A
D
 
D
P
 
P
A
 
A
A
 
K
L
 
L
A
 
A
R
 
Q
D
 
A
Y
 
Y
E
 
Q
A
 
D
G
 
G
G
 
G
A
 
A
T
 
R
W
 
I
I
 
V
S
 
S
V
 
V
L
 
V
T
 
T
E
 
E
E
 
Q
R
 
R
R
 
R
F
|
F
N
 
Q
G
 
G
S
 
S
L
 
L
A
 
D
D
 
D
L
 
L
E
 
D
A
 
A
V
 
V
H
 
R
K
 
A
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
V
L
 
L
R
 
R
K
|
K
D
|
D
F
 
F
V
 
V
V
 
V
S
 
Q
S
 
P
Y
 
Y
Q
 
Q
L
 
I
W
 
H
E
 
E
A
 
A
R
 
R
V
 
A
H
 
H
G
 
G
A
 
A
S
 
D
A
 
M
I
 
L
L
|
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
A
L
 
L
P
 
E
Q
 
Q
E
 
S
A
 
V
L
 
L
V
 
V
S
 
S
L
 
M
V
 
L
E
 
D
R
 
R
A
 
T
R
 
E
S
 
S
L
 
L
G
 
G
L
 
M
T
 
T
P
 
A
L
 
L
V
 
V
E
|
E
V
 
V
H
 
H
D
 
T
E
 
E
D
 
Q
E
 
E
V
 
A
T
 
D
R
 
R
A
 
A
L
 
L
D
 
K
A
 
A
G
 
G
A
 
A
T
 
K
V
 
V
I
 
I
G
 
G
V
 
V
N
|
N
A
 
A
R
 
R
N
 
D
L
 
-
K
 
-
T
 
-
L
 
-
E
 
-
V
 
V
D
 
D
R
 
R
D
 
D
T
 
C
F
 
F
A
 
A
R
 
R
L
 
I
A
 
A
P
 
P
L
 
G
I
 
L
P
 
P
A
 
S
D
 
S
R
 
V
V
 
I
K
 
R
I
 
I
A
 
A
E
|
E
S
|
S
G
 
G
V
 
V
R
 
R
G
 
G
P
 
T
H
 
A
D
 
D
L
 
L
L
 
L
A
 
A
Y
 
Y
A
 
A
G
 
G
A
 
A
G
 
G
A
 
A
G
 
D
A
 
A
V
 
V
L
 
L
V
 
V
G
 
G
E
 
E
S
 
G
L
 
L
V
 
V
R
 
T
G
 
S
G
 
G
N
 
D
P
 
P
R
 
R
E
 
A
A
 
A
V
 
V
A
 
A
D
 
D
L
 
L
V
 
V
T
 
T
A
 
A
G
 
G
A
 
T
H
 
H
P
 
P
A
 
S
L
 
C

1vc4B Crystal structure of indole-3-glycerol phosphate synthase (trpc) from thermus thermophilus at 1.8 a resolution (see paper)
47% identity, 92% coverage: 10:256/268 of query aligns to 10:253/254 of 1vc4B

query
sites
1vc4B
G
 
G
V
 
V
R
 
L
A
 
G
D
 
E
L
 
I
A
 
A
R
 
R
R
 
K
Q
 
R
E
 
A
A
 
S
L
 
E
P
 
V
L
 
A
D
 
P
R
 
Y
L
 
P
K
 
L
A
 
P
Q
 
E
A
 
P
E
 
P
S
 
S
V
 
V
P
 
P
T
 
S
P
 
F
Q
 
K
D
 
E
A
 
A
E
 
-
A
 
-
A
 
-
L
 
L
R
 
L
R
 
R
P
 
P
G
 
G
V
 
L
H
 
S
V
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
R
 
R
A
 
Q
S
 
S
P
 
P
S
 
S
K
 
E
G
 
G
P
 
L
L
 
I
A
 
R
T
 
E
I
 
V
A
 
-
D
 
D
P
 
P
A
 
V
A
 
E
L
 
A
A
 
A
R
 
L
D
 
A
Y
 
Y
E
 
A
A
 
R
G
 
G
G
 
G
A
 
A
T
 
R
W
 
A
I
 
V
S
 
S
V
 
V
L
 
L
T
 
T
E
 
E
E
 
P
R
 
H
R
 
R
F
 
F
N
 
G
G
 
G
S
 
S
L
 
L
A
 
L
D
 
D
L
 
L
E
 
K
A
 
R
V
 
V
H
 
R
K
 
E
A
 
A
V
 
V
D
 
D
T
 
L
P
 
P
L
 
L
L
 
L
R
 
R
K
|
K
D
 
D
F
 
F
V
 
V
V
 
V
S
 
D
S
 
P
Y
 
F
Q
 
M
L
 
L
W
 
E
E
 
E
A
 
A
R
 
R
V
 
A
H
 
F
G
 
G
A
 
A
S
 
S
A
 
A
I
 
A
L
 
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
L
L
 
L
P
 
-
Q
 
G
E
 
E
A
 
L
L
 
T
V
 
G
S
 
A
L
 
Y
V
 
L
E
 
E
R
 
E
A
 
A
R
 
R
S
 
R
L
 
L
G
 
G
L
 
L
T
 
E
P
 
A
L
 
L
V
 
V
E
|
E
V
 
V
H
 
H
D
 
T
E
 
E
D
 
R
E
 
E
V
 
L
T
 
E
R
 
I
A
 
A
L
 
L
D
 
E
A
 
A
G
 
G
A
 
A
T
 
E
V
 
V
I
 
L
G
 
G
V
 
I
N
|
N
A
 
N
R
 
R
N
 
D
L
 
L
K
 
A
T
 
T
L
 
L
E
 
H
V
 
I
D
 
N
R
 
L
D
 
E
T
 
T
F
 
A
A
 
P
R
 
R
L
 
L
A
 
G
P
 
R
L
|
L
I
 
A
P
 
R
A
 
K
-
x
R
-
 
G
-
 
F
D
 
G
R
 
G
V
 
V
K
 
L
I
 
V
A
 
A
E
|
E
S
|
S
G
 
G
V
 
Y
R
 
S
G
 
R
P
 
K
H
 
E
D
 
E
L
 
L
L
 
K
A
 
A
Y
 
L
A
 
E
G
 
G
A
 
L
G
 
-
A
 
F
G
 
D
A
 
A
V
 
V
L
 
L
V
 
I
G
 
G
E
 
T
S
 
S
L
 
L
V
 
M
R
 
R
G
 
A
G
 
P
N
 
D
P
 
L
R
 
E
E
 
A
A
 
A
V
 
L
A
 
R
D
 
E
L
 
L
V
 
V

6y88B Igps (indole-3-glycerol phosphate synthase) from pseudomonas aeruginosa in complex with substrate inhibitor rcdrp (see paper)
42% identity, 92% coverage: 2:248/268 of query aligns to 4:255/265 of 6y88B

query
sites
6y88B
S
 
T
V
 
V
L
 
L
D
 
Q
E
 
K
I
 
I
L
 
L
D
 
A
G
 
R
V
 
K
R
 
A
A
 
E
D
 
E
L
 
V
A
 
A
R
 
E
R
 
R
Q
 
R
E
 
A
A
 
R
L
 
V
P
 
N
L
 
L
D
 
A
R
 
E
L
 
V
K
 
E
A
 
R
Q
 
L
A
 
A
E
 
R
S
 
S
V
 
A
P
 
D
T
 
A
P
 
P
Q
 
R
D
 
G
A
 
F
E
 
A
A
 
N
A
 
A
L
 
L
-
 
L
-
 
E
-
 
R
-
 
A
R
 
K
R
 
R
P
 
K
G
 
E
V
 
P
H
 
A
V
 
V
I
 
I
A
 
A
E
|
E
V
 
I
K
|
K
R
 
K
A
 
A
S
|
S
P
|
P
S
|
S
K
 
K
G
 
G
P
 
V
L
 
L
A
 
R
T
 
E
I
 
H
A
 
F
D
 
V
P
 
P
A
 
A
A
 
E
L
 
I
A
 
A
R
 
R
D
 
S
Y
 
Y
E
 
E
A
 
A
G
 
G
G
 
G
A
 
A
T
 
A
W
 
C
I
 
L
S
 
S
V
 
V
L
 
L
T
 
T
E
 
D
E
 
V
R
 
D
R
x
F
F
|
F
N
 
Q
G
 
G
S
 
A
L
 
D
A
 
A
D
 
Y
L
 
L
E
 
K
A
 
E
V
 
A
H
 
R
K
 
A
A
 
A
V
 
C
D
 
A
T
 
L
P
 
P
L
 
V
L
 
I
R
 
R
K
|
K
D
 
D
F
 
F
V
 
M
V
 
I
S
 
D
S
 
P
Y
 
Y
Q
 
Q
L
 
I
W
 
V
E
 
E
A
 
A
R
 
R
V
 
A
H
 
I
G
 
G
A
 
A
S
 
D
A
 
C
I
 
I
L
 
L
L
 
L
I
 
I
V
 
V
A
 
S
A
 
A
L
 
L
P
 
D
Q
 
D
E
 
V
A
 
L
L
 
M
V
 
A
S
 
E
L
 
L
V
 
A
E
 
A
R
 
T
A
 
A
R
 
K
S
 
S
L
 
V
G
 
G
L
 
L
T
 
D
P
 
V
L
 
L
V
 
V
E
|
E
V
 
V
H
 
H
D
 
D
E
 
G
D
 
T
E
 
E
V
 
L
T
 
E
R
 
R
A
 
A
L
 
L
D
 
K
A
 
T
G
 
L
A
 
D
T
 
T
-
 
P
V
 
L
I
 
V
G
 
G
V
 
I
N
|
N
A
 
N
R
|
R
N
 
N
L
|
L
K
 
H
T
 
T
L
 
F
E
 
E
V
 
V
D
 
S
R
 
L
D
 
E
T
 
T
F
 
T
A
 
L
R
 
D
L
 
L
A
 
L
P
 
P
L
 
E
I
 
I
P
 
P
A
 
R
D
 
D
R
 
R
V
 
L
K
 
V
I
 
V
A
 
T
E
|
E
S
|
S
G
 
G
V
 
I
R
 
L
G
 
N
P
 
R
H
 
A
D
 
D
L
 
V
L
 
E
A
 
L
Y
 
M
A
 
E
G
 
V
A
 
S
G
 
E
A
 
V
G
 
Y
A
 
A
V
 
F
L
|
L
V
|
V
G
|
G
E
|
E
S
 
A
L
 
F
V
 
M
R
 
R
G
 
A
G
 
D
N
 
D
P
 
P

6y88G Igps (indole-3-glycerol phosphate synthase) from pseudomonas aeruginosa in complex with substrate inhibitor rcdrp (see paper)
46% identity, 74% coverage: 51:248/268 of query aligns to 48:242/253 of 6y88G

query
sites
6y88G
V
 
V
I
 
I
A
 
A
E
|
E
V
 
I
K
|
K
R
 
K
A
 
A
S
 
S
P
 
P
S
 
S
K
 
K
G
 
G
P
 
V
L
 
L
A
 
R
T
 
E
I
 
H
A
 
F
D
 
V
P
 
P
A
 
A
A
 
E
L
 
I
A
 
A
R
 
R
D
 
S
Y
 
Y
E
 
E
A
 
A
G
 
G
G
 
G
A
 
A
T
 
A
W
 
C
I
 
L
S
 
S
V
 
V
L
 
L
T
 
T
E
 
D
E
 
Q
R
 
-
R
 
-
F
 
-
N
 
-
G
 
G
S
 
A
L
 
D
A
 
A
D
 
Y
L
 
L
E
 
K
A
 
E
V
 
A
H
 
R
K
 
A
A
 
A
V
 
C
D
 
A
T
 
L
P
 
P
L
 
V
L
 
I
R
 
R
K
|
K
D
 
D
F
 
F
V
 
M
V
 
I
S
 
D
S
 
P
Y
 
Y
Q
 
Q
L
 
I
W
 
V
E
 
E
A
 
A
R
 
R
V
 
A
H
 
I
G
 
G
A
 
A
S
 
D
A
 
C
I
 
I
L
 
L
L
 
L
I
 
I
V
 
V
A
 
S
A
 
A
L
 
L
P
 
D
Q
 
D
E
 
V
A
 
L
L
 
M
V
 
A
S
 
E
L
 
L
V
 
A
E
 
A
R
 
T
A
 
A
R
 
K
S
 
S
L
 
V
G
 
G
L
 
L
T
 
D
P
 
V
L
 
L
V
 
V
E
|
E
V
 
V
H
 
H
D
 
D
E
 
G
D
 
T
E
 
E
V
 
L
T
 
E
R
 
R
A
 
A
L
 
L
D
 
K
A
 
T
G
 
L
A
 
D
T
 
T
-
 
P
V
 
L
I
 
V
G
 
G
V
 
I
N
|
N
A
 
N
R
|
R
N
 
N
L
 
L
K
 
H
T
 
T
L
 
F
E
 
E
V
 
V
D
 
S
R
 
L
D
 
E
T
 
T
F
 
T
A
 
L
R
 
D
L
 
L
A
 
L
P
 
P
L
 
E
I
 
I
P
 
P
A
 
R
D
 
D
R
 
R
V
 
L
K
 
V
I
 
V
A
 
T
E
|
E
S
|
S
G
 
G
V
 
I
R
 
L
G
 
N
P
 
R
H
 
A
D
 
D
L
 
V
L
 
E
A
 
L
Y
 
M
A
 
E
G
 
V
A
 
S
G
 
E
A
 
V
G
 
Y
A
 
A
V
 
F
L
 
L
V
 
V
G
|
G
E
|
E
S
 
A
L
 
F
V
 
M
R
 
R
G
 
A
G
 
D
N
 
D
P
 
P

1lbfA Crystal structure of indole-3-glycerol phosphate syntase (igps)with reduced 1-(o-caboxyphenylamino)-1-deoxyribulose 5-phosphate (rcdrp) (see paper)
40% identity, 79% coverage: 45:256/268 of query aligns to 41:246/247 of 1lbfA

query
sites
1lbfA
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
R
 
R
A
 
K
S
|
S
P
|
P
S
|
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
S
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
Y
G
 
-
A
 
A
T
 
V
W
 
G
I
 
L
S
 
S
V
 
I
L
 
L
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
|
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
T
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
I
L
 
L
R
 
M
K
|
K
D
 
D
F
 
F
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
Y
G
 
G
L
 
M
T
 
E
P
 
P
L
 
L
V
 
I
E
|
E
V
 
I
H
 
N
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
 
G
V
 
I
N
|
N
A
 
S
R
|
R
N
 
D
L
|
L
K
 
E
T
 
T
L
|
L
E
 
E
V
 
I
D
 
N
R
 
K
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
A
E
|
E
S
|
S
G
|
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
R
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
|
L
V
 
I
G
|
G
E
x
S
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
F
V
 
I

Sites not aligning to the query:

1jukA Indole-3-glycerolphosphate synthase from sulfolobus solfataricus in a trigonal crystal form (see paper)
40% identity, 79% coverage: 45:256/268 of query aligns to 41:246/247 of 1jukA

query
sites
1jukA
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
R
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
S
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
Y
G
 
-
A
 
A
T
 
V
W
 
G
I
 
L
S
 
S
V
 
I
L
 
L
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
 
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
T
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
I
L
 
L
R
 
M
K
|
K
D
 
D
F
 
F
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
Y
G
 
G
L
 
M
T
 
E
P
 
P
L
 
L
V
 
I
E
|
E
V
 
I
H
 
N
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
 
G
V
 
I
N
|
N
A
 
S
R
 
R
N
 
D
L
 
L
K
 
E
T
 
T
L
 
L
E
 
E
V
 
I
D
 
N
R
 
K
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
A
E
|
E
S
|
S
G
 
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
R
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
 
L
V
 
I
G
|
G
E
x
S
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
F
V
 
I

1igsA Indole-3-glycerolphosphate synthase from sulfolobus solfataricus at 2.0 a resolution (see paper)
40% identity, 79% coverage: 45:256/268 of query aligns to 41:246/247 of 1igsA

query
sites
1igsA
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
R
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
S
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
Y
G
 
-
A
 
A
T
 
V
W
 
G
I
 
L
S
 
S
V
 
I
L
 
L
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
 
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
T
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
I
L
 
L
R
 
M
K
|
K
D
 
D
F
 
F
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
Y
G
 
G
L
 
M
T
 
E
P
 
P
L
 
L
V
 
I
E
|
E
V
 
I
H
 
N
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
 
G
V
 
I
N
|
N
A
 
S
R
 
R
N
 
D
L
 
L
K
 
E
T
 
T
L
 
L
E
 
E
V
 
I
D
 
N
R
 
K
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
A
E
|
E
S
|
S
G
 
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
R
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
 
L
V
 
I
G
|
G
E
x
S
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
F
V
 
I

1a53A Complex of indole-3-glycerolphosphate synthase from sulfolobus solfataricus with indole-3-glycerolphosphate at 2.0 a resolution (see paper)
40% identity, 79% coverage: 45:256/268 of query aligns to 41:246/247 of 1a53A

query
sites
1a53A
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
R
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
S
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
Y
G
 
-
A
 
A
T
 
V
W
 
G
I
 
L
S
 
S
V
 
I
L
 
L
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
|
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
T
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
I
L
 
L
R
 
M
K
|
K
D
 
D
F
 
F
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
Y
G
 
G
L
 
M
T
 
E
P
 
P
L
 
L
V
 
I
E
|
E
V
 
I
H
 
N
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
 
G
V
 
I
N
|
N
A
 
S
R
 
R
N
 
D
L
 
L
K
 
E
T
 
T
L
 
L
E
 
E
V
 
I
D
 
N
R
 
K
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
A
E
|
E
S
|
S
G
|
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
R
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
 
L
V
 
I
G
|
G
E
x
S
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
F
V
 
I

4iwwA Computational design of an unnatural amino acid metalloprotein with atomic level accuracy (see paper)
38% identity, 79% coverage: 45:256/268 of query aligns to 41:246/247 of 4iwwA

query
sites
4iwwA
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
R
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
A
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
Y
G
 
-
A
 
A
T
 
V
W
 
G
I
 
L
S
 
S
V
 
I
L
 
L
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
 
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
T
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
I
L
 
L
R
 
M
K
x
M
D
 
D
F
 
F
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
 
L
L
 
L
I
x
A
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
Y
G
 
G
L
 
M
T
 
E
P
 
P
L
 
L
V
x
I
E
|
E
V
 
I
H
 
T
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
 
G
V
x
I
N
 
S
A
 
S
R
 
Q
N
 
D
L
x
D
K
 
E
T
 
T
L
 
L
E
 
E
V
 
I
D
 
N
R
 
K
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
|
A
E
x
D
S
 
S
G
 
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
R
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
 
L
V
 
I
G
 
G
E
 
S
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
L
V
 
I

3uxdA Designed protein ke59 r1 7/10h with dichlorobenzotriazole (dbt) (see paper)
36% identity, 79% coverage: 45:256/268 of query aligns to 41:246/247 of 3uxdA

query
sites
3uxdA
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
I
A
 
A
E
 
V
V
 
Y
K
 
K
R
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
A
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
Y
G
 
-
A
 
A
T
 
V
W
 
G
I
 
L
S
 
V
V
 
I
L
 
L
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
 
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
D
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
I
L
 
L
R
 
M
K
x
W
D
 
D
F
 
F
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
x
G
L
 
L
I
|
I
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
Y
G
 
G
L
 
M
T
 
E
P
 
P
L
 
A
V
 
I
E
x
V
V
 
I
H
 
N
D
 
D
E
 
E
D
 
E
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
I
I
 
I
G
 
I
V
 
I
N
 
S
A
 
S
R
 
R
N
 
D
L
 
L
K
 
E
T
 
T
L
 
L
E
 
E
V
 
I
D
 
N
R
 
K
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
A
E
 
A
S
 
S
G
 
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
R
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
x
E
V
 
I
G
 
G
E
 
S
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
L
V
 
I

4ou1A Crystal structure of a computationally designed retro-aldolase covalently bound to folding probe 1 [(6-methoxynaphthalen-2-yl) (oxiran-2-yl)methanol] (see paper)
36% identity, 79% coverage: 45:256/268 of query aligns to 41:246/247 of 4ou1A

query
sites
4ou1A
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
R
 
R
A
 
K
S
x
D
P
|
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
A
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
Y
G
 
-
A
 
A
T
 
V
W
 
G
I
 
L
S
 
F
V
 
I
L
 
S
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
|
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
T
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
I
L
 
L
R
 
M
K
x
Y
D
 
D
F
 
F
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
 
A
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
Y
G
 
G
L
 
M
T
 
E
P
 
P
L
 
L
V
 
I
E
x
I
V
 
I
H
 
N
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
 
G
V
 
I
N
x
A
A
 
A
R
|
R
N
x
D
L
x
W
K
 
E
T
 
T
L
x
G
E
 
E
V
 
I
D
 
N
R
 
K
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
A
E
x
K
S
x
E
G
 
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
R
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
 
L
V
 
I
G
 
G
E
 
S
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
L
V
 
I

7etxA Crystal structure of bifunctional indole-3-glycerol phosphate synthase / phosphoribosylanthranilate isomerase (trpc) from corynebacterium glutamicum (see paper)
41% identity, 79% coverage: 46:256/268 of query aligns to 48:256/472 of 7etxA

query
sites
7etxA
R
 
R
P
 
G
G
 
G
V
 
A
H
 
R
V
 
F
I
 
I
A
 
M
E
 
E
V
 
C
K
 
K
R
 
S
A
 
A
S
 
S
P
 
P
S
 
S
K
 
L
G
 
G
P
 
M
L
 
I
A
 
R
T
 
E
I
 
H
A
 
Y
D
 
Q
P
 
P
A
 
G
A
 
E
L
 
I
A
 
A
R
 
R
D
 
V
Y
 
Y
E
 
-
A
 
S
G
 
R
G
 
Y
A
 
A
T
 
S
W
 
G
I
 
I
S
 
S
V
 
V
L
 
L
T
 
C
E
 
E
E
 
P
R
 
D
R
 
R
F
 
F
N
 
G
G
 
G
S
 
D
L
 
Y
A
 
D
D
 
H
L
 
L
E
 
A
A
 
T
V
 
V
H
 
A
K
 
A
A
 
T
V
 
S
D
 
H
T
 
L
P
 
P
L
 
V
L
 
L
R
 
C
K
 
K
D
 
D
F
 
F
V
 
I
V
 
I
S
 
D
S
 
P
Y
 
V
Q
 
Q
L
 
V
W
 
H
E
 
A
A
 
A
R
|
R
V
 
Y
H
 
F
G
 
G
A
 
A
S
x
D
A
 
A
I
 
I
L
 
L
L
 
L
I
 
M
V
 
L
A
 
S
A
 
V
L
 
L
P
 
D
Q
 
D
E
 
E
A
 
E
L
 
Y
V
 
A
S
 
A
L
 
L
V
 
A
E
 
A
R
 
E
A
 
A
R
 
A
S
 
R
L
 
F
G
 
D
L
 
L
T
 
D
P
 
I
L
 
L
V
 
T
E
 
E
V
 
V
H
 
I
D
 
D
E
 
E
D
 
E
E
 
E
V
 
V
T
 
A
R
 
R
A
 
A
L
 
I
D
 
K
A
 
L
G
 
G
A
 
A
T
 
K
V
 
I
I
 
F
G
 
G
V
 
V
N
 
N
A
 
H
R
 
R
N
 
N
L
 
L
K
 
H
T
 
D
L
 
L
E
 
S
V
 
I
D
 
D
R
 
L
D
 
D
T
 
R
F
 
S
A
 
R
R
 
R
L
 
L
A
 
S
P
 
K
L
 
L
I
 
I
P
 
P
A
 
A
D
 
D
R
 
A
V
 
V
K
 
L
I
 
V
A
 
S
E
 
E
S
 
S
G
 
G
V
 
V
R
 
R
G
 
D
P
 
T
H
 
-
D
 
E
L
 
T
L
 
V
A
 
R
Y
 
Q
A
 
L
G
 
G
A
 
G
G
 
H
A
 
S
G
 
N
A
 
A
V
 
F
L
 
L
V
 
V
G
 
G
E
 
S
S
 
Q
L
 
L
V
 
T
R
 
S
G
 
Q
G
 
E
N
 
N
P
 
V
R
 
D
E
 
L
A
 
A
V
 
A
A
 
R
D
 
E
L
 
L
V
 
V

Sites not aligning to the query:

7etyA Crystal structure of bifunctional indole-3-glycerol phosphate synthase / phosphoribosylanthranilate isomerase (trpc) from corynebacterium glutamicum in complex with reduced 1-(o-carboxyphenylamino)-1- deoxyribulose 5-phosphate (rcdrp) (see paper)
41% identity, 79% coverage: 46:256/268 of query aligns to 46:254/470 of 7etyA

query
sites
7etyA
R
 
R
P
 
G
G
 
G
V
 
A
H
 
R
V
 
F
I
 
I
A
 
M
E
|
E
V
 
C
K
|
K
R
 
S
A
 
A
S
|
S
P
|
P
S
|
S
K
 
L
G
 
G
P
x
M
L
 
I
A
 
R
T
 
E
I
 
H
A
 
Y
D
 
Q
P
 
P
A
 
G
A
 
E
L
 
I
A
 
A
R
 
R
D
 
V
Y
 
Y
E
 
-
A
 
S
G
 
R
G
 
Y
A
 
A
T
 
S
W
 
G
I
 
I
S
 
S
V
 
V
L
 
L
T
 
C
E
 
E
E
x
P
R
x
D
R
|
R
F
|
F
N
x
G
G
 
G
S
 
D
L
 
Y
A
 
D
D
 
H
L
 
L
E
 
A
A
 
T
V
 
V
H
 
A
K
 
A
A
 
T
V
 
S
D
 
H
T
 
L
P
 
P
L
 
V
L
 
L
R
 
C
K
|
K
D
 
D
F
 
F
V
 
I
V
 
I
S
 
D
S
 
P
Y
 
V
Q
 
Q
L
 
V
W
 
H
E
 
A
A
 
A
R
|
R
V
 
Y
H
 
F
G
 
G
A
 
A
S
 
D
A
 
A
I
 
I
L
 
L
L
 
L
I
 
M
V
 
L
A
 
S
A
 
V
L
 
L
P
 
D
Q
 
D
E
 
E
A
 
E
L
 
Y
V
 
A
S
 
A
L
 
L
V
 
A
E
 
A
R
 
E
A
 
A
R
 
A
S
 
R
L
 
F
G
 
D
L
 
L
T
 
D
P
 
I
L
 
L
V
 
T
E
 
E
V
 
V
H
 
I
D
 
D
E
 
E
D
 
E
E
 
E
V
 
V
T
 
A
R
 
R
A
 
A
L
 
I
D
 
K
A
 
L
G
 
G
A
 
A
T
 
K
V
 
I
I
 
F
G
 
G
V
 
V
N
 
N
A
 
H
R
 
R
N
 
N
L
|
L
K
 
H
T
 
D
L
 
L
E
 
S
V
 
I
D
 
D
R
 
L
D
 
D
T
 
R
F
 
S
A
 
R
R
 
R
L
 
L
A
 
S
P
 
K
L
 
L
I
 
I
P
 
P
A
 
A
D
 
D
R
 
A
V
 
V
K
 
L
I
 
V
A
 
S
E
 
E
S
|
S
G
 
G
V
 
V
R
|
R
G
 
D
P
 
T
H
 
-
D
 
E
L
 
T
L
 
V
A
 
R
Y
 
Q
A
 
L
G
 
G
A
 
G
G
 
H
A
 
S
G
 
N
A
 
A
V
 
F
L
 
L
V
|
V
G
|
G
E
x
S
S
 
Q
L
 
L
V
 
T
R
 
S
G
 
Q
G
 
E
N
 
N
P
 
V
R
 
D
E
 
L
A
 
A
V
 
A
A
 
R
D
 
E
L
 
L
V
 
V

Sites not aligning to the query:

3uzjA Designed protein ke59 r13 3/11h with benzotriazole (see paper)
33% identity, 93% coverage: 8:256/268 of query aligns to 4:246/247 of 3uzjA

query
sites
3uzjA
L
 
L
D
 
K
G
 
G
V
 
W
R
 
L
A
 
E
D
 
D
L
 
V
A
 
V
R
 
Q
R
 
R
Q
 
S
E
 
Q
A
 
R
L
 
R
P
 
P
L
 
S
D
 
V
R
 
R
L
 
A
K
 
S
A
 
R
Q
 
Q
A
 
R
E
 
P
S
 
I
V
 
I
P
 
S
T
 
L
P
 
K
Q
 
E
D
 
R
A
 
I
E
 
L
A
 
E
A
 
F
L
 
N
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
M
A
 
A
E
 
V
V
 
Y
K
 
K
R
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
A
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
G
G
 
-
A
 
V
T
 
V
W
 
G
I
 
L
S
 
A
V
 
I
L
 
L
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
 
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
D
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
V
P
 
P
L
 
I
L
 
L
R
 
M
K
x
W
D
 
D
F
 
I
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
 
G
L
 
L
I
|
I
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
L
G
 
G
L
 
M
T
 
E
P
 
P
L
 
A
V
 
I
E
x
V
V
 
I
H
 
H
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
x
I
V
 
I
N
 
T
A
 
S
R
 
H
N
 
D
L
 
L
K
 
E
T
 
T
L
 
L
E
 
E
V
 
I
D
 
N
R
 
N
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
V
E
 
A
S
 
S
G
 
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
Y
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
x
E
V
 
I
G
 
G
E
 
T
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
F
V
 
I

3uz5A Designed protein ke59 r13 3/11h (see paper)
33% identity, 93% coverage: 8:256/268 of query aligns to 4:246/247 of 3uz5A

query
sites
3uz5A
L
 
L
D
 
K
G
 
G
V
 
W
R
 
L
A
 
E
D
 
D
L
 
V
A
 
V
R
 
Q
R
 
R
Q
 
S
E
 
Q
A
 
R
L
 
R
P
 
P
L
 
S
D
 
V
R
 
R
L
 
A
K
 
S
A
 
R
Q
 
Q
A
 
R
E
 
P
S
 
I
V
 
I
P
 
S
T
 
L
P
 
K
Q
 
E
D
 
R
A
 
I
E
 
L
A
 
E
A
 
F
L
 
N
R
 
K
R
 
R
P
 
N
G
 
I
V
 
T
H
 
A
V
 
I
I
 
M
A
 
A
E
 
V
V
 
Y
K
 
K
R
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
A
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
G
G
 
-
A
 
V
T
 
V
W
 
G
I
 
L
S
 
A
V
 
I
L
 
L
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
 
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
D
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
V
P
 
P
L
 
I
L
 
L
R
 
M
K
x
W
D
 
D
F
 
I
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
x
G
L
 
L
I
|
I
V
 
V
A
 
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
L
G
 
G
L
 
M
T
 
E
P
 
P
L
 
A
V
 
I
E
x
V
V
 
I
H
 
H
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
 
I
V
 
I
N
 
T
A
 
S
R
 
H
N
 
D
L
 
L
K
 
E
T
 
T
L
 
L
E
 
E
V
 
I
D
 
N
R
 
N
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
V
E
 
A
S
 
S
G
 
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
Y
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
x
E
V
 
I
G
 
G
E
 
T
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
F
V
 
I

1piiA Three-dimensional structure of the bifunctional enzyme phosphoribosylanthranilate isomerase: indoleglycerolphosphate synthase from escherichia coli refined at 2.0 angstroms resolution (see paper)
38% identity, 76% coverage: 16:220/268 of query aligns to 18:218/452 of 1piiA

query
sites
1piiA
A
 
A
R
 
R
R
 
K
Q
 
Q
E
 
Q
A
 
Q
L
 
-
P
 
P
L
 
L
D
 
A
R
 
S
L
 
F
K
 
-
A
 
-
Q
 
Q
A
 
N
E
 
E
S
 
V
V
 
Q
P
 
P
T
 
S
P
 
T
Q
 
R
D
 
H
A
 
F
E
 
Y
A
 
D
A
 
A
L
 
L
R
 
Q
R
 
G
P
 
A
G
 
R
V
 
T
H
 
A
V
 
F
I
 
I
A
 
L
E
|
E
V
 
C
K
|
K
R
 
K
A
 
A
S
 
S
P
 
P
S
 
S
K
 
K
G
 
G
P
 
V
L
 
I
A
 
R
T
 
D
I
 
D
A
 
F
D
 
D
P
 
P
A
 
A
A
 
R
L
 
I
A
 
A
R
 
A
D
 
I
Y
 
Y
E
 
K
A
 
H
G
 
Y
G
 
-
A
 
A
T
 
S
W
 
A
I
 
I
S
 
S
V
 
V
L
 
L
T
 
T
E
 
D
E
 
E
R
 
K
R
 
Y
F
 
F
N
 
Q
G
 
G
S
 
S
L
 
F
A
 
N
D
 
F
L
 
L
E
 
P
A
 
I
V
 
V
H
 
S
K
 
Q
A
 
I
V
 
A
D
 
P
T
 
Q
P
 
P
L
 
I
L
 
L
R
 
C
K
|
K
D
 
D
F
 
F
V
 
I
V
 
I
S
 
D
S
 
P
Y
 
Y
Q
 
Q
L
 
I
W
 
Y
E
 
L
A
 
A
R
 
R
V
 
Y
H
 
Y
G
 
Q
A
 
A
S
 
D
A
 
A
I
 
C
L
 
L
L
 
L
I
 
M
V
 
L
A
 
S
A
 
V
L
 
L
P
 
D
Q
 
D
E
 
D
A
 
Q
L
 
Y
V
 
R
S
 
Q
L
 
L
V
 
A
E
 
A
R
 
V
A
 
A
R
 
H
S
 
S
L
 
L
G
 
E
L
 
M
T
 
G
P
 
V
L
 
L
V
 
T
E
|
E
V
 
V
H
 
S
D
 
N
E
 
E
D
 
E
E
 
E
V
 
Q
T
 
E
R
 
R
A
 
A
L
 
I
D
 
A
A
 
L
G
 
G
A
 
A
T
 
K
V
 
V
I
 
V
G
 
G
V
 
I
N
|
N
A
 
N
R
 
R
N
 
D
L
 
L
K
 
R
T
 
D
L
 
L
E
 
S
V
 
I
D
 
D
R
 
L
D
 
N
T
 
R
F
 
T
A
 
R
R
 
E
L
 
L
A
 
A
P
 
P
L
 
K
I
 
L
P
 
G
A
 
H
D
 
N
R
 
V
V
 
T
K
 
V
I
 
I
A
 
S
E
|
E
S
|
S
G
 
G
V
 
I
R
 
N

Sites not aligning to the query:

4a2rA Structure of the engineered retro-aldolase ra95.5-5 (see paper)
33% identity, 81% coverage: 40:256/268 of query aligns to 12:246/247 of 4a2rA

query
sites
4a2rA
A
 
V
E
 
Q
A
 
L
A
 
S
L
 
L
R
 
R
R
 
R
P
 
P
G
 
S
V
 
V
H
 
H
-
 
A
-
 
S
-
 
R
-
 
Q
-
 
R
-
 
P
-
 
I
-
 
I
-
 
S
-
 
L
-
 
N
-
 
E
-
 
R
-
 
I
-
 
L
-
 
E
-
 
F
-
 
N
-
 
K
-
 
S
-
 
N
-
 
I
-
 
T
-
 
A
V
 
I
I
 
I
A
 
A
E
x
Y
V
 
Y
K
x
T
R
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
-
G
 
-
P
 
G
L
 
L
A
 
D
T
 
V
I
 
E
A
 
R
D
 
D
P
 
P
A
 
I
A
 
E
L
 
Y
A
 
A
R
 
K
D
 
F
Y
 
M
E
 
E
A
 
R
G
 
Y
G
 
-
A
 
A
T
 
V
W
 
G
I
 
L
S
 
S
V
 
I
L
x
K
T
 
T
E
 
E
E
 
E
R
 
K
R
 
Y
F
 
F
N
 
N
G
 
G
S
 
S
L
 
Y
A
 
E
D
 
M
L
 
L
E
 
R
A
 
K
V
 
I
H
 
A
K
 
S
A
 
S
V
 
V
D
 
S
T
 
I
P
 
P
L
 
I
L
 
L
R
 
M
K
x
N
D
|
D
F
|
F
V
 
I
V
 
V
S
 
K
S
 
E
Y
 
S
Q
 
Q
L
 
I
W
 
D
E
 
D
A
 
A
R
 
Y
V
 
N
H
 
L
G
 
G
A
 
A
S
 
D
A
 
T
I
 
V
L
 
L
L
 
L
I
|
I
V
 
V
A
x
K
A
 
I
L
 
L
P
 
T
Q
 
E
E
 
R
A
 
E
L
 
L
V
 
E
S
 
S
L
 
L
V
 
L
E
 
E
R
 
Y
A
 
A
R
 
R
S
 
S
L
 
Y
G
 
G
L
 
M
T
 
E
P
 
P
L
 
L
V
 
I
E
x
L
V
 
I
H
 
N
D
 
D
E
 
E
D
 
N
E
 
D
V
 
L
T
 
D
R
 
I
A
 
A
L
 
L
D
 
R
A
 
I
G
 
G
A
 
A
T
 
R
V
 
F
I
 
I
G
 
S
V
 
I
N
x
F
A
 
S
R
 
M
N
 
N
L
x
F
K
 
E
T
 
T
L
 
G
E
 
E
V
 
I
D
 
N
R
 
K
D
 
E
T
 
N
F
 
Q
A
 
R
R
 
K
L
 
L
A
 
I
P
 
S
L
 
M
I
 
I
P
 
P
A
 
S
D
 
N
R
 
V
V
 
V
K
 
K
I
 
V
A
 
A
E
x
K
S
x
L
G
 
G
V
 
I
R
 
S
G
 
E
P
 
R
H
 
N
D
 
E
L
 
I
L
 
E
A
 
E
Y
 
L
A
 
R
G
 
K
A
 
L
G
 
G
A
 
V
G
 
N
A
 
A
V
 
F
L
 
L
V
 
I
G
 
S
E
 
S
S
 
S
L
 
L
V
 
M
R
 
R
G
 
-
G
 
-
N
 
N
P
 
P
R
 
-
E
 
E
A
 
K
V
 
I
A
 
K
D
 
E
L
 
L
V
 
I

Sites not aligning to the query:

Query Sequence

>WP_017600183.1 NCBI__GCF_000341125.1:WP_017600183.1
MSVLDEILDGVRADLARRQEALPLDRLKAQAESVPTPQDAEAALRRPGVHVIAEVKRASP
SKGPLATIADPAALARDYEAGGATWISVLTEERRFNGSLADLEAVHKAVDTPLLRKDFVV
SSYQLWEARVHGASAILLIVAALPQEALVSLVERARSLGLTPLVEVHDEDEVTRALDAGA
TVIGVNARNLKTLEVDRDTFARLAPLIPADRVKIAESGVRGPHDLLAYAGAGAGAVLVGE
SLVRGGNPREAVADLVTAGAHPALRDRN

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory