SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_012501773.1 NCBI__GCF_000020505.1:WP_012501773.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

3t55A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with phenoxymethyl benzoic acid (pmba)
47% identity, 79% coverage: 50:251/256 of query aligns to 47:248/258 of 3t55A

query
sites
3t55A
G
 
G
I
 
I
N
 
G
L
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
K
 
R
A
 
A
S
|
S
P
|
P
S
|
S
R
 
A
G
 
G
V
 
A
L
 
L
V
 
A
E
 
T
D
 
I
F
 
A
R
 
D
P
 
P
L
 
A
D
 
K
I
 
L
A
 
A
E
 
Q
R
 
A
Y
 
Y
A
 
Q
E
 
D
I
 
G
G
 
G
A
 
A
S
 
R
A
 
I
F
 
V
S
 
S
V
 
V
L
 
V
T
 
T
D
 
E
R
 
Q
Q
 
R
Y
 
R
F
|
F
Q
 
Q
G
 
G
S
 
S
P
 
L
D
 
D
Y
 
D
L
 
L
K
 
D
A
 
A
I
 
V
T
 
R
Q
 
A
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
V
L
 
L
R
 
R
K
|
K
E
x
D
F
|
F
I
 
V
I
 
V
D
 
Q
E
 
P
S
 
Y
Q
 
Q
I
 
I
Y
 
H
E
 
E
T
 
A
R
 
R
L
 
A
M
 
H
G
 
G
A
 
A
D
 
D
A
 
M
A
 
L
L
|
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
A
L
 
L
E
 
E
P
 
Q
S
 
S
Q
 
V
L
 
L
R
 
V
D
 
S
Y
 
M
L
 
L
Q
 
D
L
 
R
F
 
T
A
 
E
E
 
S
L
 
L
G
 
G
L
 
M
H
 
T
A
 
A
L
 
L
V
 
V
E
|
E
T
 
V
H
 
H
D
 
T
E
 
E
R
 
Q
E
 
E
L
 
A
D
 
D
T
 
R
A
 
A
L
 
L
E
 
K
Q
 
A
G
 
G
S
 
A
T
 
K
I
 
V
V
 
I
G
 
G
V
 
V
N
|
N
N
 
A
R
|
R
D
 
D
L
|
L
K
 
M
T
 
T
F
x
L
T
 
D
V
 
V
D
 
D
L
 
R
M
 
D
T
 
C
S
 
F
V
 
A
R
 
R
L
 
I
R
 
A
Q
 
P
R
 
G
M
 
L
P
 
P
D
 
S
G
 
S
I
 
V
V
 
I
S
 
R
V
 
I
A
 
A
E
|
E
S
|
S
G
 
G
M
 
V
K
 
R
H
 
G
R
 
T
D
 
A
D
 
D
I
 
L
Q
 
L
M
 
A
M
 
Y
Q
 
A
E
 
G
A
 
A
G
 
G
F
 
A
D
 
D
A
 
A
V
 
V
L
 
L
I
 
V
G
 
G
E
 
E
G
 
G
L
 
L
L
 
V
V
 
T
S
 
S
E
 
G
E
 
D
L
 
P
R
 
R

3t44A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with indole glycerol phosphate (igp) amd anthranilate
47% identity, 79% coverage: 50:251/256 of query aligns to 47:248/259 of 3t44A

query
sites
3t44A
G
 
G
I
 
I
N
 
G
L
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
K
 
R
A
 
A
S
|
S
P
|
P
S
|
S
R
 
A
G
 
G
V
 
A
L
 
L
V
 
A
E
 
T
D
 
I
F
 
A
R
 
D
P
 
P
L
 
A
D
 
K
I
 
L
A
 
A
E
 
Q
R
 
A
Y
 
Y
A
 
Q
E
 
D
I
 
G
G
 
G
A
 
A
S
 
R
A
 
I
F
 
V
S
 
S
V
 
V
L
 
V
T
 
T
D
 
E
R
 
Q
Q
 
R
Y
 
R
F
|
F
Q
 
Q
G
 
G
S
 
S
P
 
L
D
 
D
Y
 
D
L
 
L
K
 
D
A
 
A
I
 
V
T
 
R
Q
 
A
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
V
L
 
L
R
 
R
K
|
K
E
 
D
F
|
F
I
 
V
I
 
V
D
 
Q
E
 
P
S
 
Y
Q
 
Q
I
 
I
Y
 
H
E
 
E
T
 
A
R
 
R
L
 
A
M
 
H
G
 
G
A
 
A
D
 
D
A
 
M
A
 
L
L
 
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
A
L
 
L
E
 
E
P
 
Q
S
 
S
Q
 
V
L
 
L
R
 
V
D
 
S
Y
 
M
L
 
L
Q
 
D
L
 
R
F
 
T
A
 
E
E
 
S
L
 
L
G
 
G
L
 
M
H
 
T
A
 
A
L
 
L
V
 
V
E
|
E
T
 
V
H
 
H
D
 
T
E
 
E
R
 
Q
E
 
E
L
 
A
D
 
D
T
 
R
A
 
A
L
 
L
E
 
K
Q
 
A
G
 
G
S
 
A
T
 
K
I
 
V
V
 
I
G
 
G
V
 
V
N
|
N
N
 
A
R
|
R
D
 
D
L
|
L
K
 
M
T
 
T
F
 
L
T
 
D
V
 
V
D
 
D
L
 
R
M
 
D
T
 
C
S
 
F
V
 
A
R
 
R
L
 
I
R
 
A
Q
 
P
R
 
G
M
 
L
P
 
P
D
 
S
G
 
S
I
 
V
V
 
I
S
 
R
V
 
I
A
 
A
E
|
E
S
|
S
G
 
G
M
 
V
K
 
R
H
 
G
R
 
T
D
 
A
D
 
D
I
 
L
Q
 
L
M
 
A
M
 
Y
Q
 
A
E
 
G
A
 
A
G
 
G
F
 
A
D
 
D
A
 
A
V
 
V
L
|
L
I
x
V
G
|
G
E
|
E
G
 
G
L
 
L
L
 
V
V
 
T
S
 
S
E
 
G
E
 
D
L
 
P
R
 
R

3t78A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with 5-fluoroanthranilate
47% identity, 79% coverage: 50:251/256 of query aligns to 47:246/257 of 3t78A

query
sites
3t78A
G
 
G
I
 
I
N
 
G
L
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
K
 
R
A
 
A
S
|
S
P
|
P
S
|
S
R
 
A
G
 
G
V
 
A
L
 
L
V
 
A
E
 
T
D
 
I
F
 
A
R
 
D
P
 
P
L
 
A
D
 
K
I
 
L
A
 
A
E
 
Q
R
 
A
Y
 
Y
A
 
Q
E
 
D
I
 
G
G
 
G
A
 
A
S
 
R
A
 
I
F
 
V
S
 
S
V
 
V
L
 
V
T
 
T
D
 
E
R
 
Q
Q
 
R
Y
 
R
F
|
F
Q
 
Q
G
 
G
S
 
S
P
 
L
D
 
D
Y
 
D
L
 
L
K
 
D
A
 
A
I
 
V
T
 
R
Q
 
A
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
V
L
 
L
R
 
R
K
|
K
E
 
D
F
|
F
I
 
V
I
 
V
D
 
Q
E
 
P
S
 
Y
Q
 
Q
I
 
I
Y
 
H
E
 
E
T
 
A
R
 
R
L
 
A
M
 
H
G
 
G
A
 
A
D
 
D
A
 
M
A
 
L
L
 
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
A
L
 
L
E
 
E
P
 
Q
S
 
S
Q
 
V
L
 
L
R
 
V
D
 
S
Y
 
M
L
 
L
Q
 
D
L
 
R
F
 
T
A
 
E
E
 
S
L
 
L
G
 
G
L
 
M
H
 
T
A
 
A
L
 
L
V
 
V
E
|
E
T
 
V
H
 
H
D
 
T
E
 
E
R
 
Q
E
 
E
L
 
A
D
 
D
T
 
R
A
 
A
L
 
L
E
 
K
Q
 
A
G
 
G
S
 
A
T
 
K
I
 
V
V
 
I
G
 
G
V
 
V
N
|
N
N
 
A
R
|
R
D
 
D
L
|
L
K
 
M
T
 
T
F
 
L
T
 
D
V
 
R
D
 
D
L
 
C
M
 
F
T
 
A
S
 
-
V
 
-
R
 
R
L
 
I
R
 
A
Q
 
P
R
 
G
M
 
L
P
 
P
D
 
S
G
 
S
I
 
V
V
 
I
S
 
R
V
 
I
A
 
A
E
|
E
S
|
S
G
 
G
M
 
V
K
 
R
H
 
G
R
 
T
D
 
A
D
 
D
I
 
L
Q
 
L
M
 
A
M
 
Y
Q
 
A
E
 
G
A
 
A
G
 
G
F
 
A
D
 
D
A
 
A
V
 
V
L
 
L
I
 
V
G
 
G
E
 
E
G
 
G
L
 
L
L
 
V
V
 
T
S
 
S
E
 
G
E
 
D
L
 
P
R
 
R

6y88B Igps (indole-3-glycerol phosphate synthase) from pseudomonas aeruginosa in complex with substrate inhibitor rcdrp (see paper)
41% identity, 95% coverage: 2:245/256 of query aligns to 4:250/265 of 6y88B

query
sites
6y88B
T
 
T
Y
 
V
L
 
L
T
 
Q
R
 
K
I
 
I
L
 
L
E
 
A
T
 
R
K
 
K
A
 
A
E
 
E
E
 
E
V
 
V
A
 
A
E
 
E
L
 
R
K
 
R
K
 
A
Q
 
R
D
 
V
P
 
N
E
 
L
R
 
A
R
 
E
Y
 
V
H
 
E
E
 
R
A
 
L
C
 
A
G
 
R
D
 
S
L
 
A
P
 
D
A
 
A
T
 
P
R
 
R
D
 
G
F
 
F
R
 
A
S
 
N
A
 
A
I
 
L
T
 
L
-
 
E
-
 
R
S
 
A
L
 
K
D
 
R
G
 
K
G
 
E
I
 
P
N
 
A
L
 
V
I
 
I
A
 
A
E
|
E
V
 
I
K
|
K
K
 
K
A
 
A
S
|
S
P
|
P
S
|
S
R
 
K
G
 
G
V
 
V
L
 
L
V
 
R
E
 
E
D
 
H
F
 
F
R
 
V
P
 
P
L
 
A
D
 
E
I
 
I
A
 
A
E
 
R
R
 
S
Y
 
Y
A
 
E
E
 
A
I
 
G
G
 
G
A
 
A
S
 
A
A
 
C
F
 
L
S
 
S
V
 
V
L
 
L
T
 
T
D
 
D
R
 
V
Q
 
D
Y
x
F
F
|
F
Q
 
Q
G
 
G
S
 
A
P
 
D
D
 
A
Y
 
Y
L
 
L
K
 
K
A
 
E
I
 
A
T
 
R
Q
 
A
K
 
A
F
 
C
S
 
A
I
 
L
P
 
P
V
 
V
L
 
I
R
 
R
K
|
K
E
 
D
F
 
F
I
 
M
I
 
I
D
 
D
E
 
P
S
 
Y
Q
 
Q
I
 
I
Y
 
V
E
 
E
T
 
A
R
 
R
L
 
A
M
 
I
G
 
G
A
 
A
D
 
D
A
 
C
A
 
I
L
 
L
L
 
L
I
 
I
V
 
V
A
 
S
A
 
A
L
 
L
E
 
D
P
 
D
S
 
V
Q
 
L
L
 
M
R
 
A
D
 
E
Y
 
L
L
 
A
Q
 
A
L
 
T
F
 
A
A
 
K
E
 
S
L
 
V
G
 
G
L
 
L
H
 
D
A
 
V
L
 
L
V
 
V
E
|
E
T
 
V
H
 
H
D
 
D
E
 
G
R
 
T
E
 
E
L
 
L
D
 
E
T
 
R
A
 
A
L
 
L
E
 
K
Q
 
T
G
 
L
S
 
D
T
 
T
-
 
P
I
 
L
V
 
V
G
 
G
V
 
I
N
|
N
N
 
N
R
|
R
D
 
N
L
|
L
K
 
H
T
 
T
F
 
F
T
 
E
V
 
V
D
 
S
L
 
L
M
 
E
T
 
T
S
 
T
V
 
L
R
 
D
L
 
L
R
 
L
Q
 
P
R
 
E
M
 
I
P
 
P
D
 
R
G
 
D
I
 
R
V
 
L
S
 
V
V
 
V
A
 
T
E
|
E
S
|
S
G
 
G
M
 
I
K
 
L
H
 
N
R
 
R
D
 
A
D
 
D
I
 
V
Q
 
E
M
 
L
M
 
M
Q
 
E
E
 
V
A
 
S
G
 
E
F
 
V
D
 
Y
A
 
A
V
 
F
L
|
L
I
x
V
G
|
G
E
|
E
G
 
A
L
 
F
L
 
M

1vc4B Crystal structure of indole-3-glycerol phosphate synthase (trpc) from thermus thermophilus at 1.8 a resolution (see paper)
41% identity, 96% coverage: 4:250/256 of query aligns to 12:245/254 of 1vc4B

query
sites
1vc4B
L
 
L
T
 
G
R
 
E
I
 
I
L
 
A
E
 
R
T
 
K
K
 
R
A
 
A
E
 
S
E
 
E
V
 
V
A
 
A
E
 
P
L
 
Y
K
 
P
K
 
L
Q
 
P
D
 
E
P
 
P
E
 
-
R
 
-
R
 
-
Y
 
-
H
 
-
E
 
-
A
 
-
C
 
-
G
 
-
D
 
-
L
 
-
P
 
P
A
 
S
T
 
V
R
 
P
D
 
S
F
 
F
R
 
K
S
 
E
A
 
A
I
 
L
T
 
-
S
 
-
L
 
L
D
 
R
G
 
P
G
 
G
I
 
L
N
 
S
L
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
K
 
R
A
 
Q
S
 
S
P
 
P
S
 
S
R
 
E
G
 
G
V
 
-
L
 
L
V
 
I
E
 
R
D
 
E
F
 
V
R
 
D
P
 
P
L
 
V
D
 
E
I
 
A
A
 
A
E
 
L
R
 
A
Y
 
Y
A
 
A
E
 
R
I
 
G
G
 
G
A
 
A
S
 
R
A
 
A
F
 
V
S
 
S
V
 
V
L
 
L
T
 
T
D
 
E
R
 
P
Q
 
H
Y
 
R
F
 
F
Q
 
G
G
 
G
S
 
S
P
 
L
D
 
L
Y
 
D
L
 
L
K
 
K
A
 
R
I
 
V
T
 
R
Q
 
E
K
 
A
F
 
V
S
 
D
I
 
L
P
 
P
V
 
L
L
 
L
R
 
R
K
|
K
E
 
D
F
 
F
I
 
V
I
 
V
D
 
D
E
 
P
S
 
F
Q
 
M
I
 
L
Y
 
E
E
 
E
T
 
A
R
 
R
L
 
A
M
 
F
G
 
G
A
 
A
D
 
S
A
 
A
A
 
A
L
 
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
L
L
 
L
E
 
-
P
 
-
S
 
G
Q
 
E
L
 
L
R
 
T
D
 
G
-
 
A
Y
 
Y
L
 
L
Q
 
E
L
 
E
F
 
A
A
 
R
E
 
R
L
 
L
G
 
G
L
 
L
H
 
E
A
 
A
L
 
L
V
 
V
E
|
E
T
 
V
H
 
H
D
 
T
E
 
E
R
 
R
E
 
E
L
 
L
D
 
E
T
 
I
A
 
A
L
 
L
E
 
E
Q
 
A
G
 
G
S
 
A
T
 
E
I
 
V
V
 
L
G
 
G
V
 
I
N
|
N
N
 
N
R
 
R
D
 
D
L
 
L
K
 
A
T
 
T
F
 
L
T
 
H
V
 
I
D
 
N
L
 
L
M
 
E
T
 
T
S
 
A
V
 
P
R
 
R
L
 
L
-
 
G
-
 
R
-
x
L
-
 
A
R
 
R
Q
 
K
R
|
R
M
 
G
P
 
F
D
 
G
G
 
G
I
 
V
V
 
L
S
 
-
V
 
V
A
 
A
E
|
E
S
|
S
G
 
G
M
 
Y
K
 
S
H
 
R
R
 
K
D
 
E
D
 
E
I
 
L
Q
 
K
M
 
A
M
 
L
Q
 
-
E
 
E
A
 
G
G
 
L
F
 
F
D
 
D
A
 
A
V
 
V
L
 
L
I
 
I
G
 
G
E
 
T
G
 
S
L
 
L
L
 
M
V
 
R
S
 
A
E
 
P
E
 
D
L
 
L

6y88G Igps (indole-3-glycerol phosphate synthase) from pseudomonas aeruginosa in complex with substrate inhibitor rcdrp (see paper)
44% identity, 75% coverage: 53:245/256 of query aligns to 48:237/253 of 6y88G

query
sites
6y88G
L
 
V
I
 
I
A
 
A
E
|
E
V
 
I
K
|
K
K
 
K
A
 
A
S
 
S
P
 
P
S
 
S
R
 
K
G
 
G
V
 
V
L
 
L
V
 
R
E
 
E
D
 
H
F
 
F
R
 
V
P
 
P
L
 
A
D
 
E
I
 
I
A
 
A
E
 
R
R
 
S
Y
 
Y
A
 
E
E
 
A
I
 
G
G
 
G
A
 
A
S
 
A
A
 
C
F
 
L
S
 
S
V
 
V
L
 
L
T
 
T
D
 
D
R
 
-
Q
 
-
Y
 
-
F
 
-
Q
 
Q
G
 
G
S
 
A
P
 
D
D
 
A
Y
 
Y
L
 
L
K
 
K
A
 
E
I
 
A
T
 
R
Q
 
A
K
 
A
F
 
C
S
 
A
I
 
L
P
 
P
V
 
V
L
 
I
R
 
R
K
|
K
E
 
D
F
 
F
I
 
M
I
 
I
D
 
D
E
 
P
S
 
Y
Q
 
Q
I
 
I
Y
 
V
E
 
E
T
 
A
R
 
R
L
 
A
M
 
I
G
 
G
A
 
A
D
 
D
A
 
C
A
 
I
L
 
L
L
 
L
I
 
I
V
 
V
A
 
S
A
 
A
L
 
L
E
 
D
P
 
D
S
 
V
Q
 
L
L
 
M
R
 
A
D
 
E
Y
 
L
L
 
A
Q
 
A
L
 
T
F
 
A
A
 
K
E
 
S
L
 
V
G
 
G
L
 
L
H
 
D
A
 
V
L
 
L
V
 
V
E
|
E
T
 
V
H
 
H
D
 
D
E
 
G
R
 
T
E
 
E
L
 
L
D
 
E
T
 
R
A
 
A
L
 
L
E
 
K
Q
 
T
G
 
L
S
 
D
T
 
T
-
 
P
I
 
L
V
 
V
G
 
G
V
 
I
N
|
N
N
 
N
R
|
R
D
 
N
L
 
L
K
 
H
T
 
T
F
 
F
T
 
E
V
 
V
D
 
S
L
 
L
M
 
E
T
 
T
S
 
T
V
 
L
R
 
D
L
 
L
R
 
L
Q
 
P
R
 
E
M
 
I
P
 
P
D
 
R
G
 
D
I
 
R
V
 
L
S
 
V
V
 
V
A
 
T
E
|
E
S
|
S
G
 
G
M
 
I
K
 
L
H
 
N
R
 
R
D
 
A
D
 
D
I
 
V
Q
 
E
M
 
L
M
 
M
Q
 
E
E
 
V
A
 
S
G
 
E
F
 
V
D
 
Y
A
 
A
V
 
F
L
 
L
I
 
V
G
|
G
E
|
E
G
 
A
L
 
F
L
 
M

3t40A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) complex with n-2-carboxyphenyl glycine (cpg)
44% identity, 79% coverage: 50:251/256 of query aligns to 47:234/251 of 3t40A

query
sites
3t40A
G
 
G
I
 
I
N
 
G
L
 
V
I
 
I
A
 
A
E
|
E
V
 
V
K
|
K
K
 
R
A
 
T
S
 
-
P
 
-
S
 
-
R
 
-
G
 
-
V
 
-
L
 
-
V
 
I
E
 
A
D
 
D
F
 
-
R
 
-
P
 
P
L
 
A
D
 
K
I
 
L
A
 
A
E
 
Q
R
 
A
Y
 
Y
A
 
Q
E
 
D
I
 
G
G
 
G
A
 
A
S
 
R
A
 
I
F
 
V
S
 
S
V
 
V
L
 
V
T
 
T
D
 
E
R
 
Q
Q
 
R
Y
 
R
F
|
F
Q
 
Q
G
 
G
S
 
S
P
 
L
D
 
D
Y
 
D
L
 
L
K
 
D
A
 
A
I
 
V
T
 
R
Q
 
A
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
V
L
 
L
R
 
R
K
|
K
E
x
D
F
 
F
I
 
V
I
 
V
D
 
Q
E
 
P
S
 
Y
Q
 
Q
I
 
I
Y
 
H
E
 
E
T
 
A
R
 
R
L
 
A
M
 
H
G
 
G
A
 
A
D
 
D
A
 
M
A
 
L
L
|
L
L
 
L
I
 
I
V
 
V
A
 
A
A
 
A
L
 
L
E
 
E
P
 
Q
S
 
S
Q
 
V
L
 
L
R
 
V
D
 
S
Y
 
M
L
 
L
Q
 
D
L
 
R
F
 
T
A
 
E
E
 
S
L
 
L
G
 
G
L
 
M
H
 
T
A
 
A
L
 
L
V
 
V
E
|
E
T
 
V
H
 
H
D
 
T
E
 
E
R
 
Q
E
 
E
L
 
A
D
 
D
T
 
R
A
 
A
L
 
L
E
 
K
Q
 
A
G
 
G
S
 
A
T
 
K
I
 
V
V
 
I
G
 
G
V
 
V
N
|
N
N
 
A
R
 
R
D
 
D
L
 
-
K
 
-
T
 
-
F
 
-
T
 
-
V
 
V
D
 
D
L
 
R
M
 
D
T
 
C
S
 
F
V
 
A
R
 
R
L
 
I
R
 
A
Q
 
P
R
 
G
M
 
L
P
 
P
D
 
S
G
 
S
I
 
V
V
 
I
S
 
R
V
 
I
A
 
A
E
|
E
S
|
S
G
 
G
M
 
V
K
 
R
H
 
G
R
 
T
D
 
A
D
 
D
I
 
L
Q
 
L
M
 
A
M
 
Y
Q
 
A
E
 
G
A
 
A
G
 
G
F
 
A
D
 
D
A
 
A
V
 
V
L
 
L
I
 
V
G
 
G
E
 
E
G
 
G
L
 
L
L
 
V
V
 
T
S
 
S
E
 
G
E
 
D
L
 
P
R
 
R

1piiA Three-dimensional structure of the bifunctional enzyme phosphoribosylanthranilate isomerase: indoleglycerolphosphate synthase from escherichia coli refined at 2.0 angstroms resolution (see paper)
36% identity, 98% coverage: 2:251/256 of query aligns to 3:246/452 of 1piiA

query
sites
1piiA
T
 
T
Y
 
V
L
 
L
T
 
A
R
 
K
I
 
I
L
 
V
E
 
A
T
 
D
K
 
K
A
 
A
E
 
I
E
 
W
V
 
V
A
 
E
E
 
A
L
 
R
K
 
K
K
 
Q
Q
 
Q
D
 
Q
P
 
P
E
 
L
R
 
A
R
 
S
Y
 
F
H
 
Q
E
 
N
A
 
E
C
 
V
G
 
Q
D
 
-
L
 
-
P
 
P
A
 
S
T
 
T
R
 
R
D
 
H
F
 
F
R
 
Y
S
 
D
A
 
A
I
 
L
T
 
Q
S
 
G
L
 
-
D
 
-
G
 
A
G
 
R
I
 
T
N
 
A
L
 
F
I
 
I
A
 
L
E
|
E
V
 
C
K
|
K
K
 
K
A
 
A
S
 
S
P
 
P
S
 
S
R
 
K
G
 
G
V
 
V
L
 
I
V
 
R
E
 
D
D
 
D
F
 
F
R
 
D
P
 
P
L
 
A
D
 
R
I
 
I
A
 
A
E
 
A
R
 
I
Y
 
Y
A
 
K
E
 
H
I
 
Y
G
 
-
A
 
A
S
 
S
A
 
A
F
 
I
S
 
S
V
 
V
L
 
L
T
 
T
D
 
D
R
 
E
Q
 
K
Y
 
Y
F
 
F
Q
 
Q
G
 
G
S
 
S
P
 
F
D
 
N
Y
 
F
L
 
L
K
 
P
A
 
I
I
 
V
T
 
S
Q
 
Q
K
 
I
F
 
A
S
 
P
I
 
Q
P
 
P
V
 
I
L
 
L
R
 
C
K
|
K
E
 
D
F
 
F
I
 
I
I
 
I
D
 
D
E
 
P
S
 
Y
Q
 
Q
I
 
I
Y
 
Y
E
 
L
T
 
A
R
 
R
L
 
Y
M
 
Y
G
 
Q
A
 
A
D
 
D
A
 
A
A
 
C
L
 
L
L
 
L
I
 
M
V
 
L
A
 
S
A
 
V
L
 
L
E
 
D
P
 
D
S
 
D
Q
 
Q
L
 
Y
R
 
R
D
 
Q
Y
 
L
L
 
A
Q
 
A
L
 
V
F
 
A
A
 
H
E
 
S
L
 
L
G
 
E
L
 
M
H
 
G
A
 
V
L
 
L
V
 
T
E
|
E
T
 
V
H
 
S
D
 
N
E
 
E
R
 
E
E
 
E
L
 
Q
D
 
E
T
 
R
A
 
A
L
 
I
E
 
A
Q
 
L
G
 
G
S
 
A
T
 
K
I
 
V
V
 
V
G
 
G
V
 
I
N
|
N
N
 
N
R
 
R
D
 
D
L
 
L
K
 
R
T
 
D
F
 
L
T
 
S
V
 
I
D
 
D
L
 
L
M
 
N
T
 
R
S
 
T
V
 
R
R
 
E
L
 
L
R
 
A
Q
 
P
R
 
K
M
 
L
P
 
G
D
 
H
G
 
N
I
 
V
V
 
T
S
 
V
V
 
I
A
 
S
E
|
E
S
|
S
G
 
G
M
 
I
K
 
N
H
 
T
R
 
Y
D
 
A
D
 
Q
I
 
V
Q
 
R
M
 
E
M
 
L
Q
 
S
E
 
H
A
 
F
G
 
A
F
 
-
D
 
N
A
 
G
V
 
F
L
 
L
I
|
I
G
|
G
E
x
S
G
 
A
L
 
L
L
 
M
V
 
A
S
 
H
E
 
D
E
 
D
L
 
L
R
 
H

Sites not aligning to the query:

1jcmP Trpc stability mutant containing an engineered disulphide bridge and in complex with a cdrp-related substrate (see paper)
35% identity, 97% coverage: 4:251/256 of query aligns to 5:246/259 of 1jcmP

query
sites
1jcmP
L
 
L
T
 
A
R
 
K
I
|
I
L
 
V
E
 
A
T
 
D
K
 
K
A
 
A
E
 
I
E
 
W
V
 
V
A
 
E
E
 
A
L
 
R
K
 
K
K
 
Q
Q
 
Q
D
 
Q
P
 
P
E
 
L
R
 
A
R
 
S
Y
 
F
H
 
Q
E
 
N
A
 
E
C
 
V
G
 
Q
D
 
-
L
 
-
P
 
P
A
 
S
T
 
T
R
 
R
D
 
H
F
 
F
R
 
Y
S
 
D
A
 
A
I
 
L
T
 
Q
S
 
G
L
 
-
D
 
-
G
 
A
G
 
R
I
 
T
N
 
A
L
 
F
I
 
I
A
 
L
E
|
E
V
 
C
K
|
K
K
 
K
A
 
A
S
|
S
P
|
P
S
|
S
R
 
K
G
 
G
V
 
V
L
 
I
V
 
R
E
 
D
D
 
D
F
 
F
R
 
D
P
 
P
L
 
A
D
 
R
I
 
I
A
 
A
E
 
A
R
 
I
Y
 
Y
A
 
K
E
 
H
I
 
Y
G
 
-
A
 
A
S
 
S
A
 
A
F
 
I
S
 
S
V
 
V
L
 
L
T
 
T
D
 
D
R
 
E
Q
 
K
Y
 
Y
F
|
F
Q
 
Q
G
 
G
S
 
S
P
 
F
D
 
N
Y
 
F
L
 
L
K
 
P
A
 
I
I
 
V
T
 
S
Q
 
Q
K
 
I
F
 
A
S
 
P
I
 
Q
P
 
P
V
 
I
L
 
L
R
 
C
K
|
K
E
 
D
F
 
F
I
 
I
I
 
I
D
 
D
E
 
P
S
 
Y
Q
 
Q
I
 
I
Y
 
Y
E
 
L
T
 
A
R
 
R
L
 
Y
M
 
Y
G
 
Q
A
 
A
D
 
D
A
 
A
A
 
C
L
 
L
L
 
L
I
 
M
V
 
L
A
 
S
A
 
V
L
 
L
E
 
D
P
 
D
S
 
D
Q
 
Q
L
 
Y
R
 
R
D
 
Q
Y
 
L
L
 
A
Q
 
A
L
 
V
F
 
A
A
 
H
E
 
S
L
 
L
G
 
E
L
 
M
H
 
G
A
 
V
L
 
L
V
 
T
E
 
E
T
 
V
H
 
S
D
 
N
E
 
E
R
 
E
E
 
E
L
 
Q
D
 
E
T
 
R
A
 
A
L
 
I
E
 
A
Q
 
L
G
 
G
S
 
A
T
 
K
I
 
V
V
 
V
G
 
G
V
 
I
N
 
N
N
 
N
R
 
R
D
 
D
L
|
L
K
 
C
T
 
D
F
x
L
T
 
S
V
 
I
D
 
D
L
 
L
M
 
N
T
 
R
S
 
T
V
 
R
R
 
E
L
 
L
R
 
A
Q
 
P
R
 
K
M
 
L
P
 
G
D
 
H
G
 
N
I
 
V
V
 
T
S
 
V
V
 
I
A
 
S
E
 
E
S
|
S
G
 
G
M
 
I
K
 
N
H
 
T
R
 
Y
D
 
A
D
 
Q
I
 
V
Q
x
R
M
 
E
M
 
L
Q
 
S
E
x
H
A
 
F
G
 
A
F
 
-
D
 
N
A
 
G
V
 
F
L
|
L
I
|
I
G
|
G
E
x
S
G
 
A
L
 
L
L
 
M
V
 
A
S
 
H
E
 
D
E
 
D
L
 
L
R
 
H

1lbfA Crystal structure of indole-3-glycerol phosphate syntase (igps)with reduced 1-(o-caboxyphenylamino)-1-deoxyribulose 5-phosphate (rcdrp) (see paper)
38% identity, 79% coverage: 53:253/256 of query aligns to 47:245/247 of 1lbfA

query
sites
1lbfA
L
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
K
 
R
A
 
K
S
|
S
P
|
P
S
|
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
S
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
 
S
V
 
I
L
 
L
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
|
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
T
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
|
K
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
L
V
 
I
E
|
E
T
 
I
H
 
N
D
 
D
E
 
E
R
 
N
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
F
V
 
I
G
 
G
V
 
I
N
|
N
N
 
S
R
|
R
D
 
D
L
|
L
K
 
E
T
 
T
F
x
L
T
 
E
V
 
I
D
 
N
L
 
K
M
 
E
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
 
A
E
|
E
S
|
S
G
|
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
|
L
I
 
I
G
|
G
E
x
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
-
 
P
E
 
E
E
 
K
L
 
I
R
 
K
Q
 
E
F
 
F

Sites not aligning to the query:

1jukA Indole-3-glycerolphosphate synthase from sulfolobus solfataricus in a trigonal crystal form (see paper)
38% identity, 79% coverage: 53:253/256 of query aligns to 47:245/247 of 1jukA

query
sites
1jukA
L
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
S
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
 
S
V
 
I
L
 
L
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
 
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
T
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
|
K
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
L
V
 
I
E
|
E
T
 
I
H
 
N
D
 
D
E
 
E
R
 
N
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
F
V
 
I
G
 
G
V
 
I
N
|
N
N
 
S
R
 
R
D
 
D
L
 
L
K
 
E
T
 
T
F
 
L
T
 
E
V
 
I
D
 
N
L
 
K
M
 
E
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
 
A
E
|
E
S
|
S
G
 
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
|
G
E
x
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
-
 
P
E
 
E
E
 
K
L
 
I
R
 
K
Q
 
E
F
 
F

1igsA Indole-3-glycerolphosphate synthase from sulfolobus solfataricus at 2.0 a resolution (see paper)
38% identity, 79% coverage: 53:253/256 of query aligns to 47:245/247 of 1igsA

query
sites
1igsA
L
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
S
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
 
S
V
 
I
L
 
L
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
 
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
T
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
|
K
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
L
V
 
I
E
|
E
T
 
I
H
 
N
D
 
D
E
 
E
R
 
N
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
F
V
 
I
G
 
G
V
 
I
N
|
N
N
 
S
R
 
R
D
 
D
L
 
L
K
 
E
T
 
T
F
 
L
T
 
E
V
 
I
D
 
N
L
 
K
M
 
E
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
 
A
E
|
E
S
|
S
G
 
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
|
G
E
x
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
-
 
P
E
 
E
E
 
K
L
 
I
R
 
K
Q
 
E
F
 
F

1a53A Complex of indole-3-glycerolphosphate synthase from sulfolobus solfataricus with indole-3-glycerolphosphate at 2.0 a resolution (see paper)
38% identity, 79% coverage: 53:253/256 of query aligns to 47:245/247 of 1a53A

query
sites
1a53A
L
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
S
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
 
S
V
 
I
L
 
L
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
|
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
T
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
|
K
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
L
V
 
I
E
|
E
T
 
I
H
 
N
D
 
D
E
 
E
R
 
N
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
F
V
 
I
G
 
G
V
 
I
N
|
N
N
 
S
R
 
R
D
 
D
L
 
L
K
 
E
T
 
T
F
 
L
T
 
E
V
 
I
D
 
N
L
 
K
M
 
E
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
 
A
E
|
E
S
|
S
G
|
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
|
G
E
x
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
-
 
P
E
 
E
E
 
K
L
 
I
R
 
K
Q
 
E
F
 
F

4iwwA Computational design of an unnatural amino acid metalloprotein with atomic level accuracy (see paper)
36% identity, 77% coverage: 53:249/256 of query aligns to 47:240/247 of 4iwwA

query
sites
4iwwA
L
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
A
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
 
S
V
 
I
L
 
L
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
 
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
T
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
x
M
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
 
L
L
 
L
I
x
A
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
L
V
x
I
E
|
E
T
 
I
H
 
T
D
 
D
E
 
E
R
 
N
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
F
V
 
I
G
 
G
V
x
I
N
 
S
N
 
S
R
 
Q
D
 
D
L
x
D
K
 
E
T
 
T
F
 
L
T
 
E
V
 
I
D
 
N
L
 
K
M
 
E
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
|
A
E
x
D
S
 
S
G
 
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
 
G
E
 
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
E
 
P
E
 
E

7etxA Crystal structure of bifunctional indole-3-glycerol phosphate synthase / phosphoribosylanthranilate isomerase (trpc) from corynebacterium glutamicum (see paper)
34% identity, 100% coverage: 2:256/256 of query aligns to 5:258/472 of 7etxA

query
sites
7etxA
T
 
T
Y
 
V
L
 
L
T
 
E
R
 
S
I
 
I
L
 
V
E
 
E
T
 
G
K
 
R
A
 
R
E
 
G
E
 
H
V
 
L
A
 
E
E
 
E
L
 
I
K
 
R
K
 
A
Q
 
-
D
 
-
P
 
-
E
 
-
R
 
R
R
 
I
Y
 
A
H
 
H
E
 
V
A
 
D
C
 
V
G
 
D
D
 
A
L
 
L
P
 
P
-
 
K
A
 
S
T
|
T
R
 
R
D
 
S
F
 
L
R
 
F
S
 
D
A
 
S
I
 
L
T
 
N
S
 
Q
L
 
G
D
 
R
G
 
G
G
 
G
I
 
A
N
 
R
L
 
F
I
 
I
A
 
M
E
 
E
V
 
C
K
 
K
K
 
S
A
 
A
S
 
S
P
 
P
S
 
S
R
 
L
G
 
G
V
 
M
L
 
I
V
 
R
E
 
E
D
 
H
F
 
Y
R
 
Q
P
 
P
L
 
G
D
 
E
I
 
I
A
 
A
E
 
R
R
 
V
Y
 
Y
A
 
S
E
 
R
I
 
Y
G
 
-
A
 
A
S
 
S
A
 
G
F
 
I
S
 
S
V
 
V
L
 
L
T
 
C
D
 
E
R
 
P
Q
 
D
Y
 
R
F
 
F
Q
 
G
G
 
G
S
 
D
P
 
Y
D
 
D
Y
 
H
L
 
L
K
 
A
A
 
T
I
 
V
T
 
A
Q
 
A
K
 
T
F
 
S
S
 
H
I
 
L
P
 
P
V
 
V
L
 
L
R
 
C
K
 
K
E
 
D
F
 
F
I
 
I
I
 
I
D
 
D
E
 
P
S
 
V
Q
 
Q
I
 
V
Y
 
H
E
 
A
T
 
A
R
|
R
L
 
Y
M
 
F
G
 
G
A
 
A
D
|
D
A
 
A
A
 
I
L
 
L
L
 
L
I
 
M
V
 
L
A
 
S
A
 
V
L
 
L
E
 
D
P
 
D
S
 
E
Q
 
E
L
 
Y
R
 
A
D
 
A
Y
 
L
L
 
A
Q
 
A
L
 
E
F
 
A
A
 
A
E
 
R
L
 
F
G
 
D
L
 
L
H
 
D
A
 
I
L
 
L
V
 
T
E
 
E
T
 
V
H
 
I
D
 
D
E
 
E
R
 
E
E
 
E
L
 
V
D
 
A
T
 
R
A
 
A
L
 
I
E
 
K
Q
 
L
G
 
G
S
 
A
T
 
K
I
 
I
V
 
F
G
 
G
V
 
V
N
 
N
N
 
H
R
 
R
D
 
N
L
 
L
K
 
H
T
 
D
F
 
L
T
 
S
V
 
I
D
 
D
L
 
L
M
 
D
T
 
R
S
 
S
V
 
R
R
 
R
L
 
L
R
 
S
Q
 
K
R
 
L
M
 
I
P
 
P
D
 
A
G
 
D
I
 
A
V
 
V
S
 
L
V
 
V
A
 
S
E
 
E
S
 
S
G
 
G
M
 
V
K
 
-
H
 
-
R
 
R
D
 
D
D
 
T
I
 
E
Q
 
T
M
 
V
M
 
R
Q
 
Q
E
 
L
A
 
G
G
 
G
F
 
H
-
 
S
D
 
N
A
 
A
V
 
F
L
 
L
I
 
V
G
 
G
E
 
S
G
 
Q
L
 
L
L
 
T
V
 
S
S
 
Q
E
 
E
E
 
N
L
 
V
-
 
D
-
 
L
-
 
A
-
 
A
R
 
R
Q
 
E
F
 
L
S
 
V
W
 
Y
G
 
G

Sites not aligning to the query:

7etyA Crystal structure of bifunctional indole-3-glycerol phosphate synthase / phosphoribosylanthranilate isomerase (trpc) from corynebacterium glutamicum in complex with reduced 1-(o-carboxyphenylamino)-1- deoxyribulose 5-phosphate (rcdrp) (see paper)
34% identity, 100% coverage: 2:256/256 of query aligns to 3:256/470 of 7etyA

query
sites
7etyA
T
 
T
Y
 
V
L
 
L
T
 
E
R
 
S
I
|
I
L
 
V
E
 
E
T
 
G
K
 
R
A
 
R
E
 
G
E
 
H
V
 
L
A
 
E
E
 
E
L
 
I
K
 
R
K
 
A
Q
 
-
D
 
-
P
 
-
E
 
-
R
 
R
R
 
I
Y
 
A
H
 
H
E
 
V
A
 
D
C
 
V
G
 
D
D
 
A
L
 
L
P
 
P
-
 
K
A
 
S
T
|
T
R
 
R
D
 
S
F
 
L
R
 
F
S
 
D
A
 
S
I
 
L
T
 
N
S
 
Q
L
 
G
D
 
R
G
 
G
G
 
G
I
 
A
N
 
R
L
 
F
I
 
I
A
 
M
E
|
E
V
 
C
K
|
K
K
 
S
A
 
A
S
|
S
P
|
P
S
|
S
R
 
L
G
 
G
V
x
M
L
 
I
V
 
R
E
 
E
D
 
H
F
 
Y
R
 
Q
P
 
P
L
 
G
D
 
E
I
 
I
A
 
A
E
 
R
R
 
V
Y
 
Y
A
 
S
E
 
R
I
 
Y
G
 
-
A
 
A
S
 
S
A
 
G
F
 
I
S
 
S
V
 
V
L
 
L
T
 
C
D
 
E
R
x
P
Q
x
D
Y
x
R
F
|
F
Q
x
G
G
 
G
S
 
D
P
 
Y
D
 
D
Y
 
H
L
 
L
K
 
A
A
 
T
I
 
V
T
 
A
Q
 
A
K
 
T
F
 
S
S
 
H
I
 
L
P
 
P
V
 
V
L
 
L
R
 
C
K
|
K
E
 
D
F
 
F
I
 
I
I
 
I
D
 
D
E
 
P
S
 
V
Q
 
Q
I
 
V
Y
 
H
E
 
A
T
 
A
R
|
R
L
 
Y
M
 
F
G
 
G
A
 
A
D
 
D
A
 
A
A
 
I
L
 
L
L
 
L
I
 
M
V
 
L
A
 
S
A
 
V
L
 
L
E
 
D
P
 
D
S
 
E
Q
 
E
L
 
Y
R
 
A
D
 
A
Y
 
L
L
 
A
Q
 
A
L
 
E
F
 
A
A
 
A
E
 
R
L
 
F
G
 
D
L
 
L
H
 
D
A
 
I
L
 
L
V
 
T
E
 
E
T
 
V
H
 
I
D
 
D
E
 
E
R
 
E
E
 
E
L
 
V
D
 
A
T
 
R
A
 
A
L
 
I
E
 
K
Q
 
L
G
 
G
S
 
A
T
 
K
I
 
I
V
 
F
G
 
G
V
 
V
N
 
N
N
 
H
R
 
R
D
 
N
L
|
L
K
 
H
T
 
D
F
 
L
T
 
S
V
 
I
D
 
D
L
 
L
M
 
D
T
 
R
S
 
S
V
 
R
R
 
R
L
 
L
R
 
S
Q
 
K
R
 
L
M
 
I
P
 
P
D
 
A
G
 
D
I
 
A
V
 
V
S
 
L
V
 
V
A
 
S
E
 
E
S
|
S
G
 
G
M
 
V
K
 
-
H
 
-
R
|
R
D
 
D
D
 
T
I
 
E
Q
 
T
M
 
V
M
 
R
Q
 
Q
E
 
L
A
 
G
G
 
G
F
 
H
-
 
S
D
 
N
A
 
A
V
 
F
L
 
L
I
x
V
G
|
G
E
x
S
G
 
Q
L
 
L
L
 
T
V
 
S
S
 
Q
E
 
E
E
 
N
L
 
V
-
 
D
-
 
L
-
 
A
-
 
A
R
 
R
Q
 
E
F
 
L
S
 
V
W
 
Y
G
 
G

Sites not aligning to the query:

4ou1A Crystal structure of a computationally designed retro-aldolase covalently bound to folding probe 1 [(6-methoxynaphthalen-2-yl) (oxiran-2-yl)methanol] (see paper)
34% identity, 77% coverage: 53:249/256 of query aligns to 47:240/247 of 4ou1A

query
sites
4ou1A
L
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
K
 
R
A
 
K
S
x
D
P
|
P
S
 
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
A
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
 
F
V
 
I
L
 
S
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
|
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
T
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
x
Y
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
 
A
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
L
V
 
I
E
x
I
T
 
I
H
 
N
D
 
D
E
 
E
R
 
N
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
F
V
 
I
G
 
G
V
 
I
N
x
A
N
 
A
R
|
R
D
|
D
L
x
W
K
 
E
T
 
T
F
x
G
T
 
E
V
 
I
D
 
N
L
 
K
M
 
E
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
 
A
E
x
K
S
x
E
G
 
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
 
G
E
 
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
E
 
P
E
 
E

5k7jA Structure of designed zinc binding protein ze2 bound to zn2+ (see paper)
34% identity, 79% coverage: 53:253/256 of query aligns to 47:238/240 of 5k7jA

query
sites
5k7jA
L
 
I
I
 
I
A
 
A
E
|
E
V
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
S
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
 
S
V
 
I
L
 
L
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
 
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
T
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
x
A
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
 
L
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
L
V
 
I
E
x
G
T
 
I
H
 
N
D
 
D
E
 
E
R
 
N
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
F
V
 
I
G
 
G
V
 
I
N
x
H
N
 
S
R
x
H
D
 
N
L
 
K
K
 
E
T
 
-
F
 
-
T
 
-
V
 
-
D
 
-
L
 
-
M
 
-
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
 
A
E
x
A
S
x
H
G
 
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
 
G
E
 
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
-
 
P
E
 
E
E
 
K
L
 
I
R
 
K
Q
 
E
F
 
F

3uxdA Designed protein ke59 r1 7/10h with dichlorobenzotriazole (dbt) (see paper)
35% identity, 77% coverage: 53:249/256 of query aligns to 47:240/247 of 3uxdA

query
sites
3uxdA
L
 
I
I
 
I
A
 
A
E
 
V
V
 
Y
K
 
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
A
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
 
V
V
 
I
L
 
L
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
 
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
D
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
x
W
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
x
G
L
 
L
I
|
I
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
A
V
 
I
E
x
V
T
 
I
H
 
N
D
 
D
E
 
E
R
 
E
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
I
V
 
I
G
 
I
V
 
I
N
 
S
N
 
S
R
 
R
D
 
D
L
 
L
K
 
E
T
 
T
F
 
L
T
 
E
V
 
I
D
 
N
L
 
K
M
 
E
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
 
A
E
 
A
S
 
S
G
 
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
x
E
I
 
I
G
 
G
E
 
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
E
 
P
E
 
E

3nz1A Crystal structure of kemp elimination catalyst 1a53-2 complexed with transition state analog 5-nitro benzotriazole (see paper)
32% identity, 80% coverage: 53:256/256 of query aligns to 47:248/249 of 3nz1A

query
sites
3nz1A
L
 
I
I
 
I
A
 
A
E
x
A
V
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
R
 
-
G
 
G
V
 
L
L
 
D
V
 
V
E
 
E
D
 
R
F
 
-
R
 
D
P
 
P
L
 
I
D
 
E
I
 
Y
A
 
S
E
 
-
R
 
K
Y
 
F
A
 
M
E
 
E
I
 
R
G
 
Y
A
 
A
S
 
V
A
 
G
F
 
L
S
x
A
V
 
I
L
 
A
T
 
T
D
 
E
R
 
E
Q
 
K
Y
 
Y
F
 
F
Q
 
N
G
 
G
S
 
S
P
 
Y
D
 
E
Y
 
T
L
 
L
K
 
R
A
 
K
I
 
I
T
 
A
Q
 
S
K
 
S
F
 
V
S
 
S
I
 
I
P
 
P
V
 
I
L
 
L
R
 
M
K
x
W
E
 
D
F
 
F
I
 
I
I
 
V
D
 
K
E
 
E
S
 
S
Q
 
Q
I
 
I
Y
 
D
E
 
D
T
 
A
R
 
Y
L
 
N
M
 
L
G
 
G
A
 
A
D
 
D
A
 
T
A
 
V
L
 
A
L
 
L
I
 
I
V
 
V
A
 
K
A
 
I
L
 
L
E
 
T
P
 
E
S
 
R
Q
 
E
L
 
L
R
 
E
D
 
S
Y
 
L
L
 
L
Q
 
E
L
 
Y
F
 
A
A
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
H
 
E
A
 
P
L
 
A
V
 
I
E
x
V
T
 
I
H
 
N
D
 
D
E
 
E
R
 
N
E
 
D
L
 
L
D
 
D
T
 
I
A
 
A
L
 
L
E
 
R
Q
 
I
G
 
G
S
 
A
T
 
R
I
 
F
V
 
I
G
x
E
V
 
I
N
x
A
N
 
S
R
 
R
D
 
D
L
 
L
K
 
E
T
 
T
F
 
L
T
 
E
V
 
I
D
 
N
L
 
K
M
 
E
T
 
N
S
 
Q
V
 
R
R
 
K
L
 
L
R
 
I
Q
 
S
R
 
M
M
 
I
P
 
P
D
 
S
G
 
N
I
 
V
V
 
V
S
 
K
V
 
V
A
 
A
E
x
W
S
x
Q
G
 
G
M
 
I
K
 
S
H
 
E
R
 
R
D
 
N
D
 
E
I
 
I
Q
 
E
M
 
E
M
 
L
Q
 
R
E
 
K
A
 
L
G
 
G
F
 
V
D
 
N
A
 
A
V
 
F
L
 
G
I
 
I
G
 
G
E
 
S
G
 
S
L
 
L
L
 
M
V
 
R
S
 
N
-
 
P
E
 
E
E
 
K
L
 
I
R
 
K
Q
 
E
F
 
F
S
 
I
W
 
L
G
 
G

Query Sequence

>WP_012501773.1 NCBI__GCF_000020505.1:WP_012501773.1
MTYLTRILETKAEEVAELKKQDPERRYHEACGDLPATRDFRSAITSLDGGINLIAEVKKA
SPSRGVLVEDFRPLDIAERYAEIGASAFSVLTDRQYFQGSPDYLKAITQKFSIPVLRKEF
IIDESQIYETRLMGADAALLIVAALEPSQLRDYLQLFAELGLHALVETHDERELDTALEQ
GSTIVGVNNRDLKTFTVDLMTSVRLRQRMPDGIVSVAESGMKHRDDIQMMQEAGFDAVLI
GEGLLVSEELRQFSWG

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory