SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_010966437.1 NCBI__GCF_000008765.1:WP_010966437.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

1piiA Three-dimensional structure of the bifunctional enzyme phosphoribosylanthranilate isomerase: indoleglycerolphosphate synthase from escherichia coli refined at 2.0 angstroms resolution (see paper)
40% identity, 95% coverage: 2:250/262 of query aligns to 4:247/452 of 1piiA

query
sites
1piiA
I
 
V
L
 
L
D
 
A
D
 
K
I
 
I
V
 
V
R
 
A
D
 
D
K
 
K
K
 
A
L
 
I
Q
 
W
L
 
V
I
 
E
E
 
A
D
 
R
K
 
K
K
 
Q
A
 
Q
L
 
Q
S
 
P
L
 
L
D
 
A
D
 
S
I
 
F
K
 
Q
S
 
-
K
 
-
L
 
-
N
 
N
S
 
E
L
 
V
N
 
Q
L
 
P
D
 
S
K
 
T
R
 
R
N
 
H
F
 
F
K
 
Y
E
 
D
A
 
A
L
 
L
E
 
Q
K
 
G
E
 
A
N
 
R
I
 
T
S
 
A
I
 
F
I
 
I
A
 
L
E
|
E
I
 
C
K
|
K
K
 
K
A
 
A
S
 
S
P
 
P
S
 
S
K
 
K
G
 
G
V
 
V
I
 
I
R
 
R
E
 
D
D
 
D
F
 
F
N
 
D
P
 
P
V
 
A
K
 
R
I
 
I
G
 
A
Q
 
A
I
 
I
Y
 
Y
E
 
K
N
 
H
I
 
Y
N
 
-
I
 
A
D
 
S
A
 
A
V
 
I
S
 
S
I
 
V
L
 
L
T
 
T
E
 
D
K
 
E
K
 
K
Y
 
Y
F
 
F
L
 
Q
G
 
G
K
 
S
N
 
F
E
 
N
Y
 
F
I
 
L
K
 
P
I
 
I
V
 
V
K
 
S
E
 
Q
V
 
I
N
 
A
S
 
P
K
 
Q
P
 
P
I
 
I
L
 
L
R
 
C
K
|
K
D
 
D
F
 
F
I
 
I
V
 
I
D
 
D
E
 
P
Y
 
Y
Q
 
Q
L
 
I
Y
 
Y
E
 
L
A
 
A
K
 
R
L
 
Y
I
 
Y
G
 
Q
A
 
A
D
 
D
A
 
A
V
 
C
L
 
L
L
 
L
I
 
M
A
 
L
A
 
S
V
 
V
L
 
L
K
 
D
D
 
D
-
 
D
-
 
Q
-
 
Y
K
 
R
L
 
Q
E
 
L
C
 
A
F
 
A
Y
 
V
N
 
A
R
 
H
T
 
S
L
 
L
E
 
E
L
 
M
G
 
G
L
 
V
D
 
-
S
 
-
I
 
L
T
 
T
E
|
E
V
 
V
H
 
S
N
 
N
E
 
E
E
 
E
E
 
E
A
 
Q
K
 
E
L
 
R
A
 
A
S
 
I
E
 
A
I
 
L
G
 
G
C
 
A
S
 
K
I
 
V
I
 
V
G
 
G
I
 
I
N
|
N
N
 
N
R
 
R
D
 
D
L
 
L
R
 
R
D
 
D
F
 
L
S
 
S
T
 
I
D
 
D
I
 
L
T
 
N
T
 
R
T
 
T
K
 
R
R
 
E
L
 
L
M
 
A
K
 
P
Y
 
K
V
 
L
P
 
G
R
 
H
D
 
N
R
 
V
I
 
T
I
 
V
V
 
I
S
 
S
E
|
E
S
|
S
S
 
G
I
 
I
K
 
N
T
 
T
P
 
Y
E
 
A
D
 
Q
I
 
V
L
 
R
Y
 
E
L
 
L
R
 
S
S
 
H
I
 
F
G
 
-
V
 
A
N
 
N
A
 
G
V
 
F
L
 
L
I
|
I
G
|
G
E
x
S
T
 
A
F
 
L
M
 
M
R
 
A
N
 
H
I
 
-
D
 
D
D
 
D
L
 
L
K
 
H
G
 
A

Sites not aligning to the query:

1jcmP Trpc stability mutant containing an engineered disulphide bridge and in complex with a cdrp-related substrate (see paper)
39% identity, 95% coverage: 2:250/262 of query aligns to 4:247/259 of 1jcmP

query
sites
1jcmP
I
 
V
L
 
L
D
 
A
D
 
K
I
|
I
V
 
V
R
 
A
D
 
D
K
 
K
K
 
A
L
 
I
Q
 
W
L
 
V
I
 
E
E
 
A
D
 
R
K
 
K
K
 
Q
A
 
Q
L
 
Q
S
 
P
L
 
L
D
 
A
D
 
S
I
 
F
K
 
Q
S
 
-
K
 
-
L
 
-
N
 
N
S
 
E
L
 
V
N
 
Q
L
 
P
D
 
S
K
 
T
R
 
R
N
 
H
F
 
F
K
 
Y
E
 
D
A
 
A
L
 
L
E
 
Q
K
 
G
E
 
A
N
 
R
I
 
T
S
 
A
I
 
F
I
 
I
A
 
L
E
|
E
I
 
C
K
|
K
K
 
K
A
 
A
S
|
S
P
|
P
S
|
S
K
 
K
G
 
G
V
 
V
I
 
I
R
 
R
E
 
D
D
 
D
F
 
F
N
 
D
P
 
P
V
 
A
K
 
R
I
 
I
G
 
A
Q
 
A
I
 
I
Y
 
Y
E
 
K
N
 
H
I
 
Y
N
 
A
I
 
-
D
 
S
A
 
A
V
 
I
S
 
S
I
 
V
L
 
L
T
 
T
E
 
D
K
 
E
K
 
K
Y
 
Y
F
|
F
L
 
Q
G
 
G
K
 
S
N
 
F
E
 
N
Y
 
F
I
 
L
K
 
P
I
 
I
V
 
V
K
 
S
E
 
Q
V
 
I
N
 
A
S
 
P
K
 
Q
P
 
P
I
 
I
L
 
L
R
 
C
K
|
K
D
 
D
F
 
F
I
 
I
V
 
I
D
 
D
E
 
P
Y
 
Y
Q
 
Q
L
 
I
Y
 
Y
E
 
L
A
 
A
K
 
R
L
 
Y
I
 
Y
G
 
Q
A
 
A
D
 
D
A
 
A
V
 
C
L
 
L
L
 
L
I
 
M
A
 
L
A
 
S
V
 
V
L
 
L
K
 
D
D
 
D
-
 
D
-
 
Q
-
 
Y
K
 
R
L
 
Q
E
 
L
C
 
A
F
 
A
Y
 
V
N
 
A
R
 
H
T
 
S
L
 
L
E
 
E
L
 
M
G
 
G
L
 
V
D
 
-
S
 
-
I
 
L
T
 
T
E
 
E
V
 
V
H
 
S
N
 
N
E
 
E
E
 
E
E
 
E
A
 
Q
K
 
E
L
 
R
A
 
A
S
 
I
E
 
A
I
 
L
G
 
G
C
 
A
S
 
K
I
 
V
I
 
V
G
 
G
I
 
I
N
 
N
N
 
N
R
 
R
D
 
D
L
|
L
R
 
C
D
 
D
F
x
L
S
 
S
T
 
I
D
 
D
I
 
L
T
 
N
T
 
R
T
 
T
K
 
R
R
 
E
L
 
L
M
 
A
K
 
P
Y
 
K
V
 
L
P
 
G
R
 
H
D
 
N
R
 
V
I
 
T
I
 
V
V
 
I
S
 
S
E
 
E
S
|
S
S
 
G
I
 
I
K
 
N
T
 
T
P
 
Y
E
 
A
D
 
Q
I
 
V
L
x
R
Y
 
E
L
 
L
R
 
S
S
x
H
I
 
F
G
 
A
V
 
-
N
 
N
A
 
G
V
 
F
L
|
L
I
|
I
G
|
G
E
x
S
T
 
A
F
 
L
M
 
M
R
 
A
N
 
H
I
 
-
D
 
D
D
 
D
L
 
L
K
 
H
G
 
A

6y88B Igps (indole-3-glycerol phosphate synthase) from pseudomonas aeruginosa in complex with substrate inhibitor rcdrp (see paper)
37% identity, 94% coverage: 2:246/262 of query aligns to 5:254/265 of 6y88B

query
sites
6y88B
I
 
V
L
 
L
D
 
Q
D
 
K
I
 
I
V
 
L
R
 
A
D
 
R
K
 
K
K
 
A
L
 
E
Q
 
E
L
 
V
I
 
A
E
 
E
D
 
R
K
 
R
K
 
A
A
 
R
L
 
V
S
 
N
L
 
L
D
 
A
D
 
E
I
 
V
K
 
E
S
 
R
K
 
L
L
 
A
N
 
R
S
 
S
L
 
A
N
 
D
L
 
A
D
 
-
K
 
P
R
 
R
N
 
G
F
 
F
K
 
A
E
 
N
A
 
A
L
 
L
-
 
L
-
 
E
-
 
R
-
 
A
E
 
K
K
 
R
E
 
K
N
 
E
I
 
P
S
 
A
I
 
V
I
 
I
A
 
A
E
|
E
I
 
I
K
|
K
K
 
K
A
 
A
S
|
S
P
|
P
S
|
S
K
 
K
G
 
G
V
 
V
I
 
L
R
 
R
E
 
E
D
 
H
F
 
F
N
 
V
P
 
P
V
 
A
K
 
E
I
 
I
G
 
A
Q
 
R
I
 
S
Y
 
Y
E
 
E
N
 
A
I
 
G
N
 
G
I
 
A
D
 
A
A
 
C
V
 
L
S
 
S
I
 
V
L
 
L
T
 
T
E
 
D
K
 
V
K
 
D
Y
x
F
F
|
F
L
 
Q
G
 
G
K
 
A
N
 
D
E
 
A
Y
 
Y
I
 
L
K
 
K
I
 
E
V
 
A
K
 
R
E
 
A
V
 
A
N
 
C
S
 
A
K
 
L
P
 
P
I
 
V
L
 
I
R
 
R
K
|
K
D
 
D
F
 
F
I
 
M
V
 
I
D
 
D
E
 
P
Y
 
Y
Q
 
Q
L
 
I
Y
 
V
E
 
E
A
 
A
K
 
R
L
 
A
I
 
I
G
 
G
A
 
A
D
 
D
A
 
C
V
 
I
L
 
L
L
 
L
I
 
I
A
 
V
A
 
S
V
 
A
L
 
L
K
 
D
D
 
D
K
 
V
L
 
L
E
 
M
C
 
A
F
 
E
Y
 
L
N
 
A
R
 
A
T
 
T
L
 
A
E
 
K
-
 
S
L
 
V
G
 
G
L
 
L
D
 
D
S
 
V
I
 
L
T
 
V
E
|
E
V
 
V
H
 
H
N
 
D
E
 
G
E
 
T
E
 
E
A
 
L
K
 
E
L
 
R
A
 
A
-
 
L
S
 
K
E
 
T
I
 
L
G
 
D
C
 
T
S
 
P
I
 
L
I
 
V
G
 
G
I
 
I
N
|
N
N
 
N
R
|
R
D
 
N
L
|
L
R
 
H
D
 
T
F
 
F
S
 
E
T
 
V
D
 
S
I
 
L
T
 
E
T
 
T
T
 
T
K
 
L
R
 
D
L
 
L
M
 
L
K
 
P
Y
 
E
V
 
I
P
 
P
R
 
R
D
 
D
R
 
R
I
 
L
I
 
V
V
 
V
S
 
T
E
|
E
S
|
S
S
 
G
I
 
I
K
 
L
T
 
N
P
 
R
E
 
A
D
 
D
I
 
V
L
 
E
Y
 
L
L
 
M
R
 
E
S
 
V
I
 
S
G
 
E
V
 
V
N
 
Y
A
 
A
V
 
F
L
|
L
I
x
V
G
|
G
E
|
E
T
 
A
F
 
F
M
 
M
R
 
R
N
 
A
I
 
D
D
 
D

6y88G Igps (indole-3-glycerol phosphate synthase) from pseudomonas aeruginosa in complex with substrate inhibitor rcdrp (see paper)
40% identity, 80% coverage: 37:246/262 of query aligns to 30:241/253 of 6y88G

query
sites
6y88G
K
 
P
R
 
R
N
 
G
F
 
F
K
 
A
E
 
N
A
 
A
L
 
L
-
 
L
-
 
E
-
 
R
-
 
A
E
 
K
K
 
R
E
 
K
N
 
E
I
 
P
S
 
A
I
 
V
I
 
I
A
 
A
E
|
E
I
 
I
K
|
K
K
 
K
A
 
A
S
 
S
P
 
P
S
 
S
K
 
K
G
 
G
V
 
V
I
 
L
R
 
R
E
 
E
D
 
H
F
 
F
N
 
V
P
 
P
V
 
A
K
 
E
I
 
I
G
 
A
Q
 
R
I
 
S
Y
 
Y
E
 
E
N
 
A
I
 
G
N
 
G
I
 
A
D
 
A
A
 
C
V
 
L
S
 
S
I
 
V
L
 
L
T
 
T
E
 
D
K
 
Q
K
 
-
Y
 
-
F
 
-
L
 
-
G
 
G
K
 
A
N
 
D
E
 
A
Y
 
Y
I
 
L
K
 
K
I
 
E
V
 
A
K
 
R
E
 
A
V
 
A
N
 
C
S
 
A
K
 
L
P
 
P
I
 
V
L
 
I
R
 
R
K
|
K
D
 
D
F
 
F
I
 
M
V
 
I
D
 
D
E
 
P
Y
 
Y
Q
 
Q
L
 
I
Y
 
V
E
 
E
A
 
A
K
 
R
L
 
A
I
 
I
G
 
G
A
 
A
D
 
D
A
 
C
V
 
I
L
 
L
L
 
L
I
 
I
A
 
V
A
 
S
V
 
A
L
 
L
K
 
D
D
 
D
K
 
V
L
 
L
E
 
M
C
 
A
F
 
E
Y
 
L
N
 
A
R
 
A
T
 
T
L
 
A
E
 
K
-
 
S
L
 
V
G
 
G
L
 
L
D
 
D
S
 
V
I
 
L
T
 
V
E
|
E
V
 
V
H
 
H
N
 
D
E
 
G
E
 
T
E
 
E
A
 
L
K
 
E
L
 
R
A
 
A
-
 
L
S
 
K
E
 
T
I
 
L
G
 
D
C
 
T
S
 
P
I
 
L
I
 
V
G
 
G
I
 
I
N
|
N
N
 
N
R
|
R
D
 
N
L
 
L
R
 
H
D
 
T
F
 
F
S
 
E
T
 
V
D
 
S
I
 
L
T
 
E
T
 
T
T
 
T
K
 
L
R
 
D
L
 
L
M
 
L
K
 
P
Y
 
E
V
 
I
P
 
P
R
 
R
D
 
D
R
 
R
I
 
L
I
 
V
V
 
V
S
 
T
E
|
E
S
|
S
S
 
G
I
 
I
K
 
L
T
 
N
P
 
R
E
 
A
D
 
D
I
 
V
L
 
E
Y
 
L
L
 
M
R
 
E
S
 
V
I
 
S
G
 
E
V
 
V
N
 
Y
A
 
A
V
 
F
L
 
L
I
 
V
G
|
G
E
|
E
T
 
A
F
 
F
M
 
M
R
 
R
N
 
A
I
 
D
D
 
D

3t55A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with phenoxymethyl benzoic acid (pmba)
33% identity, 97% coverage: 2:255/262 of query aligns to 2:255/258 of 3t55A

query
sites
3t55A
I
 
V
L
 
L
D
 
D
D
 
S
I
 
I
V
 
L
R
 
E
D
 
G
K
 
V
K
 
R
L
 
A
Q
 
D
L
 
V
I
 
A
E
 
A
D
 
R
K
 
E
K
 
A
A
 
S
L
 
V
S
 
S
L
 
L
D
 
S
D
 
E
I
 
I
K
 
K
S
 
A
K
 
A
L
 
A
N
 
A
S
 
A
L
 
A
N
 
P
L
 
P
D
 
-
K
 
P
R
 
L
N
 
D
F
 
V
K
 
M
E
 
A
A
 
A
L
 
L
E
 
R
K
 
E
E
 
P
N
 
G
I
 
I
S
 
G
I
 
V
I
 
I
A
 
A
E
|
E
I
 
V
K
|
K
K
 
R
A
 
A
S
|
S
P
|
P
S
|
S
K
 
A
G
 
G
V
 
A
I
 
L
R
 
A
E
 
T
D
 
I
F
 
A
N
 
D
P
 
P
V
 
A
K
 
K
I
 
L
G
 
A
Q
 
Q
I
 
A
Y
 
Y
E
 
Q
N
 
D
I
 
G
N
 
G
I
 
A
D
 
R
A
 
I
V
 
V
S
 
S
I
 
V
L
 
V
T
 
T
E
 
E
K
 
Q
K
 
R
Y
 
R
F
|
F
L
 
Q
G
 
G
K
 
S
N
 
L
E
 
D
Y
 
D
I
 
L
K
 
D
I
 
A
V
 
V
K
 
R
E
 
A
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
V
L
 
L
R
 
R
K
|
K
D
|
D
F
|
F
I
 
V
V
 
V
D
 
Q
E
 
P
Y
 
Y
Q
 
Q
L
 
I
Y
 
H
E
 
E
A
 
A
K
 
R
L
 
A
I
 
H
G
 
G
A
 
A
D
 
D
A
 
M
V
 
L
L
|
L
L
 
L
I
 
I
A
 
V
A
 
A
V
 
A
L
 
L
K
 
E
D
 
Q
K
 
S
-
 
V
L
 
L
E
 
V
C
 
S
F
 
M
Y
 
L
N
 
D
R
 
R
T
 
T
L
 
E
E
 
S
L
 
L
G
 
G
L
 
M
D
 
T
S
 
A
I
 
L
T
 
V
E
|
E
V
 
V
H
 
H
N
 
T
E
 
E
E
 
Q
E
 
E
A
 
A
K
 
D
L
 
R
A
 
A
S
 
L
E
 
K
I
 
A
G
 
G
C
 
A
S
 
K
I
 
V
I
 
I
G
 
G
I
 
V
N
|
N
N
 
A
R
|
R
D
 
D
L
|
L
R
 
M
D
 
T
F
x
L
S
 
D
T
 
V
D
 
D
I
 
R
T
 
D
T
 
C
T
 
F
K
 
A
R
 
R
L
 
I
M
 
A
K
 
P
Y
 
G
V
 
L
P
 
P
R
 
S
D
 
S
R
 
V
I
 
I
I
 
R
V
 
I
S
 
A
E
|
E
S
|
S
S
 
G
I
 
V
K
 
R
T
 
G
P
 
T
E
 
A
D
 
D
I
 
L
L
 
L
Y
 
A
L
 
Y
R
 
A
S
 
G
I
 
A
G
 
G
V
 
A
N
 
D
A
 
A
V
 
V
L
 
L
I
 
V
G
 
G
E
 
E
T
 
G
F
 
L
M
 
V
R
 
T
N
 
S
I
 
G
D
 
D
D
 
P
L
 
R
K
 
A
G
 
A
I
 
V
N
 
A
E
 
D
F
 
L
L
 
V

3t44A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with indole glycerol phosphate (igp) amd anthranilate
33% identity, 97% coverage: 2:255/262 of query aligns to 2:255/259 of 3t44A

query
sites
3t44A
I
 
V
L
 
L
D
 
D
D
 
S
I
 
I
V
 
L
R
 
E
D
 
G
K
 
V
K
 
R
L
 
A
Q
 
D
L
 
V
I
 
A
E
 
A
D
 
R
K
 
E
K
 
A
A
 
S
L
 
V
S
 
S
L
 
L
D
 
S
D
 
E
I
 
I
K
 
K
S
 
A
K
 
A
L
 
A
N
 
A
S
 
A
L
 
A
N
 
P
L
 
P
D
 
-
K
 
P
R
 
L
N
 
D
F
 
V
K
 
M
E
 
A
A
 
A
L
 
L
E
 
R
K
 
E
E
 
P
N
 
G
I
 
I
S
 
G
I
 
V
I
 
I
A
 
A
E
|
E
I
 
V
K
|
K
K
 
R
A
 
A
S
|
S
P
|
P
S
|
S
K
 
A
G
 
G
V
 
A
I
 
L
R
 
A
E
 
T
D
 
I
F
 
A
N
 
D
P
 
P
V
 
A
K
 
K
I
 
L
G
 
A
Q
 
Q
I
 
A
Y
 
Y
E
 
Q
N
 
D
I
 
G
N
 
G
I
 
A
D
 
R
A
 
I
V
 
V
S
 
S
I
 
V
L
 
V
T
 
T
E
 
E
K
 
Q
K
 
R
Y
 
R
F
|
F
L
 
Q
G
 
G
K
 
S
N
 
L
E
 
D
Y
 
D
I
 
L
K
 
D
I
 
A
V
 
V
K
 
R
E
 
A
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
V
L
 
L
R
 
R
K
|
K
D
 
D
F
|
F
I
 
V
V
 
V
D
 
Q
E
 
P
Y
 
Y
Q
 
Q
L
 
I
Y
 
H
E
 
E
A
 
A
K
 
R
L
 
A
I
 
H
G
 
G
A
 
A
D
 
D
A
 
M
V
 
L
L
 
L
L
 
L
I
 
I
A
 
V
A
 
A
V
 
A
L
 
L
K
 
E
D
 
Q
K
 
S
-
 
V
L
 
L
E
 
V
C
 
S
F
 
M
Y
 
L
N
 
D
R
 
R
T
 
T
L
 
E
E
 
S
L
 
L
G
 
G
L
 
M
D
 
T
S
 
A
I
 
L
T
 
V
E
|
E
V
 
V
H
 
H
N
 
T
E
 
E
E
 
Q
E
 
E
A
 
A
K
 
D
L
 
R
A
 
A
S
 
L
E
 
K
I
 
A
G
 
G
C
 
A
S
 
K
I
 
V
I
 
I
G
 
G
I
 
V
N
|
N
N
 
A
R
|
R
D
 
D
L
|
L
R
 
M
D
 
T
F
 
L
S
 
D
T
 
V
D
 
D
I
 
R
T
 
D
T
 
C
T
 
F
K
 
A
R
 
R
L
 
I
M
 
A
K
 
P
Y
 
G
V
 
L
P
 
P
R
 
S
D
 
S
R
 
V
I
 
I
I
 
R
V
 
I
S
 
A
E
|
E
S
|
S
S
 
G
I
 
V
K
 
R
T
 
G
P
 
T
E
 
A
D
 
D
I
 
L
L
 
L
Y
 
A
L
 
Y
R
 
A
S
 
G
I
 
A
G
 
G
V
 
A
N
 
D
A
 
A
V
 
V
L
|
L
I
x
V
G
|
G
E
|
E
T
 
G
F
 
L
M
 
V
R
 
T
N
 
S
I
 
G
D
 
D
D
 
P
L
 
R
K
 
A
G
 
A
I
 
V
N
 
A
E
 
D
F
 
L
L
 
V

1vc4B Crystal structure of indole-3-glycerol phosphate synthase (trpc) from thermus thermophilus at 1.8 a resolution (see paper)
41% identity, 79% coverage: 39:246/262 of query aligns to 36:244/254 of 1vc4B

query
sites
1vc4B
N
 
S
F
 
F
K
 
K
E
 
E
A
 
A
L
 
L
E
 
L
K
 
R
E
 
P
N
 
G
I
 
L
S
 
S
I
 
V
I
 
I
A
 
A
E
|
E
I
 
V
K
|
K
K
 
R
A
 
Q
S
 
S
P
 
P
S
 
S
K
 
E
G
 
G
V
 
L
I
 
I
R
 
R
E
 
E
D
 
-
F
 
V
N
 
D
P
 
P
V
 
V
K
 
E
I
 
A
G
 
A
Q
 
L
I
 
A
Y
 
Y
E
 
A
N
 
R
I
 
G
N
 
G
I
 
A
D
 
R
A
 
A
V
 
V
S
 
S
I
 
V
L
 
L
T
 
T
E
 
E
K
 
P
K
 
H
Y
 
R
F
 
F
L
 
G
G
 
G
K
 
S
N
 
L
E
 
L
Y
 
D
I
 
L
K
 
K
I
 
R
V
 
V
K
 
R
E
 
E
V
 
A
N
 
V
S
 
D
K
 
L
P
 
P
I
 
L
L
 
L
R
 
R
K
|
K
D
 
D
F
 
F
I
 
V
V
 
V
D
 
D
E
 
P
Y
 
F
Q
 
M
L
 
L
Y
 
E
E
 
E
A
 
A
K
 
R
L
 
A
I
 
F
G
 
G
A
 
A
D
 
S
A
 
A
V
 
A
L
 
L
L
 
L
I
 
I
A
 
V
A
 
A
V
 
L
L
 
L
K
 
G
D
 
E
K
 
L
L
 
T
E
 
G
C
 
A
F
 
Y
Y
 
L
N
 
E
R
 
E
T
 
A
L
 
R
E
 
R
L
 
L
G
 
G
L
 
L
D
 
E
S
 
A
I
 
L
T
 
V
E
|
E
V
 
V
H
 
H
N
 
T
E
 
E
E
 
R
E
 
E
A
 
L
K
 
E
L
 
I
A
 
A
S
 
L
E
 
E
I
 
A
G
 
G
C
 
A
S
 
E
I
 
V
I
 
L
G
 
G
I
 
I
N
|
N
N
 
N
R
 
R
D
 
D
L
 
L
R
 
A
D
 
T
F
 
L
S
 
H
T
 
I
D
 
N
I
 
L
T
 
E
T
 
T
T
 
A
K
 
P
R
 
R
L
 
L
M
 
G
K
 
R
Y
x
L
V
 
A
P
 
-
R
 
R
D
 
K
R
|
R
-
 
G
-
 
F
-
 
G
-
 
G
I
 
V
I
 
L
V
 
V
S
 
A
E
|
E
S
|
S
S
 
G
I
 
Y
K
 
S
T
 
R
P
 
K
E
 
E
D
 
E
I
 
L
L
 
K
Y
 
A
L
 
L
R
 
E
S
 
G
I
 
L
G
 
-
V
 
F
N
 
D
A
 
A
V
 
V
L
 
L
I
 
I
G
 
G
E
 
T
T
 
S
F
 
L
M
 
M
R
 
R
N
 
A
I
 
P
D
 
D

3t78A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) in complex with 5-fluoroanthranilate
33% identity, 97% coverage: 2:255/262 of query aligns to 2:253/257 of 3t78A

query
sites
3t78A
I
 
V
L
 
L
D
 
D
D
 
S
I
 
I
V
 
L
R
 
E
D
 
G
K
 
V
K
 
R
L
 
A
Q
 
D
L
 
V
I
 
A
E
 
A
D
 
R
K
 
E
K
 
A
A
 
S
L
 
V
S
 
S
L
 
L
D
 
S
D
 
E
I
 
I
K
 
K
S
 
A
K
 
A
L
 
A
N
 
A
S
 
A
L
 
A
N
 
P
L
 
P
D
 
-
K
 
P
R
 
L
N
 
D
F
 
V
K
 
M
E
 
A
A
 
A
L
 
L
E
 
R
K
 
E
E
 
P
N
 
G
I
 
I
S
 
G
I
 
V
I
 
I
A
 
A
E
|
E
I
 
V
K
|
K
K
 
R
A
 
A
S
|
S
P
|
P
S
|
S
K
 
A
G
 
G
V
 
A
I
 
L
R
 
A
E
 
T
D
 
I
F
 
A
N
 
D
P
 
P
V
 
A
K
 
K
I
 
L
G
 
A
Q
 
Q
I
 
A
Y
 
Y
E
 
Q
N
 
D
I
 
G
N
 
G
I
 
A
D
 
R
A
 
I
V
 
V
S
 
S
I
 
V
L
 
V
T
 
T
E
 
E
K
 
Q
K
 
R
Y
 
R
F
|
F
L
 
Q
G
 
G
K
 
S
N
 
L
E
 
D
Y
 
D
I
 
L
K
 
D
I
 
A
V
 
V
K
 
R
E
 
A
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
V
L
 
L
R
 
R
K
|
K
D
 
D
F
|
F
I
 
V
V
 
V
D
 
Q
E
 
P
Y
 
Y
Q
 
Q
L
 
I
Y
 
H
E
 
E
A
 
A
K
 
R
L
 
A
I
 
H
G
 
G
A
 
A
D
 
D
A
 
M
V
 
L
L
 
L
L
 
L
I
 
I
A
 
V
A
 
A
V
 
A
L
 
L
K
 
E
D
 
Q
K
 
S
-
 
V
L
 
L
E
 
V
C
 
S
F
 
M
Y
 
L
N
 
D
R
 
R
T
 
T
L
 
E
E
 
S
L
 
L
G
 
G
L
 
M
D
 
T
S
 
A
I
 
L
T
 
V
E
|
E
V
 
V
H
 
H
N
 
T
E
 
E
E
 
Q
E
 
E
A
 
A
K
 
D
L
 
R
A
 
A
S
 
L
E
 
K
I
 
A
G
 
G
C
 
A
S
 
K
I
 
V
I
 
I
G
 
G
I
 
V
N
|
N
N
 
A
R
|
R
D
 
D
L
|
L
R
 
M
D
 
T
F
 
L
S
 
D
T
 
R
D
 
D
I
 
-
T
 
-
T
 
C
T
 
F
K
 
A
R
 
R
L
 
I
M
 
A
K
 
P
Y
 
G
V
 
L
P
 
P
R
 
S
D
 
S
R
 
V
I
 
I
I
 
R
V
 
I
S
 
A
E
|
E
S
|
S
S
 
G
I
 
V
K
 
R
T
 
G
P
 
T
E
 
A
D
 
D
I
 
L
L
 
L
Y
 
A
L
 
Y
R
 
A
S
 
G
I
 
A
G
 
G
V
 
A
N
 
D
A
 
A
V
 
V
L
 
L
I
 
V
G
 
G
E
 
E
T
 
G
F
 
L
M
 
V
R
 
T
N
 
S
I
 
G
D
 
D
D
 
P
L
 
R
K
 
A
G
 
A
I
 
V
N
 
A
E
 
D
F
 
L
L
 
V

7etyA Crystal structure of bifunctional indole-3-glycerol phosphate synthase / phosphoribosylanthranilate isomerase (trpc) from corynebacterium glutamicum in complex with reduced 1-(o-carboxyphenylamino)-1- deoxyribulose 5-phosphate (rcdrp) (see paper)
33% identity, 94% coverage: 2:246/262 of query aligns to 4:247/470 of 7etyA

query
sites
7etyA
I
 
V
L
 
L
D
 
E
D
 
S
I
|
I
V
 
V
R
 
E
D
 
G
K
 
R
K
 
R
L
 
G
Q
 
H
L
 
L
I
 
E
E
 
E
D
 
I
K
 
R
K
 
A
A
 
R
L
 
I
S
 
A
L
 
H
D
 
V
D
 
D
I
 
V
K
 
-
S
 
-
K
 
-
L
 
-
N
 
D
S
 
A
L
 
L
N
 
P
L
 
K
D
 
S
K
x
T
R
 
R
N
 
S
F
 
L
K
 
F
E
 
D
A
 
S
L
 
L
E
 
N
-
 
Q
-
 
G
K
 
R
E
 
G
N
 
G
I
 
A
S
 
R
I
 
F
I
 
I
A
 
M
E
|
E
I
 
C
K
|
K
K
 
S
A
 
A
S
|
S
P
|
P
S
|
S
K
 
L
G
 
G
V
x
M
I
 
I
R
 
R
E
 
E
D
 
H
F
 
Y
N
 
Q
P
 
P
V
 
G
K
 
E
I
 
I
G
 
A
Q
 
R
I
 
V
Y
 
Y
E
 
S
N
 
R
I
 
Y
N
 
A
I
 
-
D
 
S
A
 
G
V
 
I
S
 
S
I
 
V
L
 
L
T
 
C
E
 
E
K
x
P
K
x
D
Y
x
R
F
|
F
L
x
G
G
 
G
K
 
D
N
 
Y
E
 
D
Y
 
H
I
 
L
K
 
A
I
 
T
V
 
V
K
 
A
E
 
A
V
 
T
N
 
S
S
 
H
K
 
L
P
 
P
I
 
V
L
 
L
R
 
C
K
|
K
D
 
D
F
 
F
I
 
I
V
 
I
D
 
D
E
 
P
Y
 
V
Q
 
Q
L
 
V
Y
 
H
E
 
A
A
 
A
K
x
R
L
 
Y
I
 
F
G
 
G
A
 
A
D
 
D
A
 
A
V
 
I
L
 
L
L
 
L
I
 
M
A
 
L
A
 
S
V
 
V
L
 
L
K
 
D
D
 
D
K
 
E
L
 
E
E
 
Y
C
 
A
F
 
A
Y
 
L
N
 
A
R
 
A
T
 
E
L
 
A
-
 
A
E
 
R
L
 
F
G
 
D
L
 
L
D
 
D
S
 
I
I
 
L
T
 
T
E
 
E
V
 
V
H
 
I
N
 
D
E
 
E
E
 
E
E
 
E
A
 
V
K
 
A
L
 
R
A
 
A
S
 
I
E
 
K
I
 
L
G
 
G
C
 
A
S
 
K
I
 
I
I
 
F
G
 
G
I
 
V
N
 
N
N
 
H
R
 
R
D
 
N
L
|
L
R
 
H
D
 
D
F
 
L
S
 
S
T
 
I
D
 
D
I
 
L
T
 
D
T
 
R
T
 
S
K
 
R
R
 
R
L
 
L
M
 
S
K
 
K
Y
 
L
V
 
I
P
 
P
R
 
A
D
 
D
R
 
A
I
 
V
I
 
L
V
 
V
S
 
S
E
 
E
S
|
S
S
 
G
I
 
V
K
x
R
T
 
D
P
 
T
E
 
E
D
 
T
I
 
V
L
 
-
Y
 
-
L
 
-
R
 
R
S
 
Q
I
 
L
G
 
G
-
 
G
-
 
H
V
 
S
N
 
N
A
 
A
V
 
F
L
 
L
I
x
V
G
|
G
E
x
S
-
 
Q
-
 
L
T
 
T
F
 
S
M
 
Q
R
 
E
N
 
N
I
 
V
D
 
D

Sites not aligning to the query:

7etxA Crystal structure of bifunctional indole-3-glycerol phosphate synthase / phosphoribosylanthranilate isomerase (trpc) from corynebacterium glutamicum (see paper)
33% identity, 94% coverage: 2:246/262 of query aligns to 6:249/472 of 7etxA

query
sites
7etxA
I
 
V
L
 
L
D
 
E
D
 
S
I
 
I
V
 
V
R
 
E
D
 
G
K
 
R
K
 
R
L
 
G
Q
 
H
L
 
L
I
 
E
E
 
E
D
 
I
K
 
R
K
 
A
A
 
R
L
 
I
S
 
A
L
 
H
D
 
V
D
 
D
I
 
V
K
 
-
S
 
-
K
 
-
L
 
-
N
 
D
S
 
A
L
 
L
N
 
P
L
 
K
D
 
S
K
x
T
R
 
R
N
 
S
F
 
L
K
 
F
E
 
D
A
 
S
L
 
L
E
 
N
-
 
Q
-
 
G
K
 
R
E
 
G
N
 
G
I
 
A
S
 
R
I
 
F
I
 
I
A
 
M
E
 
E
I
 
C
K
 
K
K
 
S
A
 
A
S
 
S
P
 
P
S
 
S
K
 
L
G
 
G
V
 
M
I
 
I
R
 
R
E
 
E
D
 
H
F
 
Y
N
 
Q
P
 
P
V
 
G
K
 
E
I
 
I
G
 
A
Q
 
R
I
 
V
Y
 
Y
E
 
S
N
 
R
I
 
Y
N
 
A
I
 
-
D
 
S
A
 
G
V
 
I
S
 
S
I
 
V
L
 
L
T
 
C
E
 
E
K
 
P
K
 
D
Y
 
R
F
 
F
L
 
G
G
 
G
K
 
D
N
 
Y
E
 
D
Y
 
H
I
 
L
K
 
A
I
 
T
V
 
V
K
 
A
E
 
A
V
 
T
N
 
S
S
 
H
K
 
L
P
 
P
I
 
V
L
 
L
R
 
C
K
 
K
D
 
D
F
 
F
I
 
I
V
 
I
D
 
D
E
 
P
Y
 
V
Q
 
Q
L
 
V
Y
 
H
E
 
A
A
 
A
K
x
R
L
 
Y
I
 
F
G
 
G
A
 
A
D
|
D
A
 
A
V
 
I
L
 
L
L
 
L
I
 
M
A
 
L
A
 
S
V
 
V
L
 
L
K
 
D
D
 
D
K
 
E
L
 
E
E
 
Y
C
 
A
F
 
A
Y
 
L
N
 
A
R
 
A
T
 
E
L
 
A
-
 
A
E
 
R
L
 
F
G
 
D
L
 
L
D
 
D
S
 
I
I
 
L
T
 
T
E
 
E
V
 
V
H
 
I
N
 
D
E
 
E
E
 
E
E
 
E
A
 
V
K
 
A
L
 
R
A
 
A
S
 
I
E
 
K
I
 
L
G
 
G
C
 
A
S
 
K
I
 
I
I
 
F
G
 
G
I
 
V
N
 
N
N
 
H
R
 
R
D
 
N
L
 
L
R
 
H
D
 
D
F
 
L
S
 
S
T
 
I
D
 
D
I
 
L
T
 
D
T
 
R
T
 
S
K
 
R
R
 
R
L
 
L
M
 
S
K
 
K
Y
 
L
V
 
I
P
 
P
R
 
A
D
 
D
R
 
A
I
 
V
I
 
L
V
 
V
S
 
S
E
 
E
S
 
S
S
 
G
I
 
V
K
 
R
T
 
D
P
 
T
E
 
E
D
 
T
I
 
V
L
 
-
Y
 
-
L
 
-
R
 
R
S
 
Q
I
 
L
G
 
G
-
 
G
-
 
H
V
 
S
N
 
N
A
 
A
V
 
F
L
 
L
I
 
V
G
 
G
E
 
S
-
 
Q
-
 
L
T
 
T
F
 
S
M
 
Q
R
 
E
N
 
N
I
 
V
D
 
D

Sites not aligning to the query:

3t40A Crystal structure of mycobacterium tuberculosis indole glycerol phosphate synthase (igps) complex with n-2-carboxyphenyl glycine (cpg)
31% identity, 97% coverage: 2:255/262 of query aligns to 2:241/251 of 3t40A

query
sites
3t40A
I
 
V
L
 
L
D
 
D
D
 
S
I
 
I
V
 
L
R
 
E
D
 
G
K
 
V
K
 
R
L
 
A
Q
 
D
L
 
V
I
 
A
E
 
A
D
 
R
K
 
E
K
 
A
A
 
S
L
 
V
S
 
S
L
 
L
D
 
S
D
 
E
I
 
I
K
 
K
S
 
A
K
 
A
L
 
A
N
 
A
S
 
A
L
 
A
N
 
P
L
 
P
D
 
-
K
 
P
R
 
L
N
 
D
F
 
V
K
 
M
E
 
A
A
 
A
L
 
L
E
 
R
K
 
E
E
 
P
N
 
G
I
 
I
S
 
G
I
 
V
I
 
I
A
 
A
E
|
E
I
 
V
K
|
K
K
 
-
A
 
-
S
 
-
P
 
-
S
 
-
K
 
-
G
 
-
V
 
-
I
 
-
R
 
R
E
 
T
D
 
I
F
 
A
N
 
D
P
 
P
V
 
A
K
 
K
I
 
L
G
 
A
Q
 
Q
I
 
A
Y
 
Y
E
 
Q
N
 
D
I
 
G
N
 
G
I
 
A
D
 
R
A
 
I
V
 
V
S
 
S
I
 
V
L
 
V
T
 
T
E
 
E
K
 
Q
K
 
R
Y
 
R
F
|
F
L
 
Q
G
 
G
K
 
S
N
 
L
E
 
D
Y
 
D
I
 
L
K
 
D
I
 
A
V
 
V
K
 
R
E
 
A
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
V
L
 
L
R
 
R
K
|
K
D
|
D
F
 
F
I
 
V
V
 
V
D
 
Q
E
 
P
Y
 
Y
Q
 
Q
L
 
I
Y
 
H
E
 
E
A
 
A
K
 
R
L
 
A
I
 
H
G
 
G
A
 
A
D
 
D
A
 
M
V
 
L
L
|
L
L
 
L
I
 
I
A
 
V
A
 
A
V
 
A
L
 
L
K
 
E
D
 
Q
K
 
S
-
 
V
L
 
L
E
 
V
C
 
S
F
 
M
Y
 
L
N
 
D
R
 
R
T
 
T
L
 
E
E
 
S
L
 
L
G
 
G
L
 
M
D
 
T
S
 
A
I
 
L
T
 
V
E
|
E
V
 
V
H
 
H
N
 
T
E
 
E
E
 
Q
E
 
E
A
 
A
K
 
D
L
 
R
A
 
A
S
 
L
E
 
K
I
 
A
G
 
G
C
 
A
S
 
K
I
 
V
I
 
I
G
 
G
I
 
V
N
|
N
N
 
A
R
 
R
D
 
D
L
 
V
R
 
-
D
 
-
F
 
-
S
 
-
T
 
-
D
 
D
I
 
R
T
 
D
T
 
C
T
 
F
K
 
A
R
 
R
L
 
I
M
 
A
K
 
P
Y
 
G
V
 
L
P
 
P
R
 
S
D
 
S
R
 
V
I
 
I
I
 
R
V
 
I
S
 
A
E
|
E
S
|
S
S
 
G
I
 
V
K
 
R
T
 
G
P
 
T
E
 
A
D
 
D
I
 
L
L
 
L
Y
 
A
L
 
Y
R
 
A
S
 
G
I
 
A
G
 
G
V
 
A
N
 
D
A
 
A
V
 
V
L
 
L
I
 
V
G
 
G
E
 
E
T
 
G
F
 
L
M
 
V
R
 
T
N
 
S
I
 
G
D
 
D
D
 
P
L
 
R
K
 
A
G
 
A
I
 
V
N
 
A
E
 
D
F
 
L
L
 
V

1lbfA Crystal structure of indole-3-glycerol phosphate syntase (igps)with reduced 1-(o-caboxyphenylamino)-1-deoxyribulose 5-phosphate (rcdrp) (see paper)
38% identity, 78% coverage: 46:249/262 of query aligns to 41:243/247 of 1lbfA

query
sites
1lbfA
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
|
E
I
 
Y
K
|
K
K
 
R
A
 
K
S
|
S
P
|
P
S
|
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
S
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
-
A
 
G
V
 
L
S
 
S
I
 
I
L
 
L
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
|
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
T
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
|
K
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
 
L
L
 
L
I
 
I
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
L
T
 
I
E
|
E
V
 
I
H
 
N
N
 
D
E
 
E
E
 
N
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
F
I
 
I
G
 
G
I
 
I
N
|
N
N
 
S
R
|
R
D
 
D
L
|
L
R
 
E
D
 
T
F
x
L
S
 
E
T
 
I
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
 
A
E
|
E
S
|
S
S
x
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
|
L
I
 
I
G
|
G
E
x
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

Sites not aligning to the query:

1jukA Indole-3-glycerolphosphate synthase from sulfolobus solfataricus in a trigonal crystal form (see paper)
38% identity, 78% coverage: 46:249/262 of query aligns to 41:243/247 of 1jukA

query
sites
1jukA
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
|
E
I
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
S
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
-
A
 
G
V
 
L
S
 
S
I
 
I
L
 
L
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
 
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
T
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
|
K
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
 
L
L
 
L
I
 
I
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
L
T
 
I
E
|
E
V
 
I
H
 
N
N
 
D
E
 
E
E
 
N
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
F
I
 
I
G
 
G
I
 
I
N
|
N
N
 
S
R
 
R
D
 
D
L
 
L
R
 
E
D
 
T
F
 
L
S
 
E
T
 
I
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
 
A
E
|
E
S
|
S
S
 
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
|
G
E
x
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

1igsA Indole-3-glycerolphosphate synthase from sulfolobus solfataricus at 2.0 a resolution (see paper)
38% identity, 78% coverage: 46:249/262 of query aligns to 41:243/247 of 1igsA

query
sites
1igsA
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
|
E
I
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
S
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
-
A
 
G
V
 
L
S
 
S
I
 
I
L
 
L
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
 
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
T
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
|
K
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
 
L
L
 
L
I
 
I
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
L
T
 
I
E
|
E
V
 
I
H
 
N
N
 
D
E
 
E
E
 
N
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
F
I
 
I
G
 
G
I
 
I
N
|
N
N
 
S
R
 
R
D
 
D
L
 
L
R
 
E
D
 
T
F
 
L
S
 
E
T
 
I
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
 
A
E
|
E
S
|
S
S
 
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
|
G
E
x
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

1a53A Complex of indole-3-glycerolphosphate synthase from sulfolobus solfataricus with indole-3-glycerolphosphate at 2.0 a resolution (see paper)
38% identity, 78% coverage: 46:249/262 of query aligns to 41:243/247 of 1a53A

query
sites
1a53A
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
|
E
I
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
S
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
-
A
 
G
V
 
L
S
 
S
I
 
I
L
 
L
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
|
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
T
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
|
K
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
 
L
L
 
L
I
 
I
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
L
T
 
I
E
|
E
V
 
I
H
 
N
N
 
D
E
 
E
E
 
N
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
F
I
 
I
G
 
G
I
 
I
N
|
N
N
 
S
R
 
R
D
 
D
L
 
L
R
 
E
D
 
T
F
 
L
S
 
E
T
 
I
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
 
A
E
|
E
S
|
S
S
x
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
|
G
E
x
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

4iwwA Computational design of an unnatural amino acid metalloprotein with atomic level accuracy (see paper)
35% identity, 78% coverage: 46:249/262 of query aligns to 41:243/247 of 4iwwA

query
sites
4iwwA
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
|
E
I
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
A
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
-
A
 
G
V
 
L
S
 
S
I
 
I
L
 
L
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
 
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
T
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
x
M
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
 
L
L
 
L
I
x
A
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
L
T
x
I
E
|
E
V
 
I
H
 
T
N
 
D
E
 
E
E
 
N
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
F
I
 
I
G
 
G
I
|
I
N
 
S
N
 
S
R
 
Q
D
 
D
L
x
D
R
 
E
D
 
T
F
 
L
S
 
E
T
 
I
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
x
A
E
x
D
S
 
S
S
 
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
 
G
E
 
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

5k7jA Structure of designed zinc binding protein ze2 bound to zn2+ (see paper)
35% identity, 78% coverage: 46:249/262 of query aligns to 41:236/240 of 5k7jA

query
sites
5k7jA
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
|
E
I
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
S
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
-
A
 
G
V
 
L
S
 
S
I
 
I
L
 
L
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
 
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
T
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
x
A
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
 
L
L
 
L
I
 
I
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
L
T
 
I
E
x
G
V
 
I
H
 
N
N
 
D
E
 
E
E
 
N
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
F
I
 
I
G
 
G
I
 
I
N
x
H
N
 
-
R
 
-
D
 
-
L
 
-
R
 
-
D
 
-
F
 
-
S
 
S
T
x
H
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
 
A
E
x
A
S
x
H
S
 
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
 
G
E
 
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

3uxdA Designed protein ke59 r1 7/10h with dichlorobenzotriazole (dbt) (see paper)
35% identity, 78% coverage: 46:249/262 of query aligns to 41:243/247 of 3uxdA

query
sites
3uxdA
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
 
V
I
 
Y
K
 
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
A
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
G
A
 
L
V
 
V
S
 
-
I
 
I
L
 
L
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
 
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
D
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
x
W
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
x
G
L
 
L
I
|
I
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
A
T
 
I
E
x
V
V
 
I
H
 
N
N
 
D
E
 
E
E
 
E
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
I
I
 
I
G
 
I
I
 
I
N
 
S
N
 
S
R
 
R
D
 
D
L
 
L
R
 
E
D
 
T
F
 
L
S
 
E
T
 
I
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
 
A
E
 
A
S
 
S
S
 
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
x
E
I
 
I
G
 
G
E
 
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

4ou1A Crystal structure of a computationally designed retro-aldolase covalently bound to folding probe 1 [(6-methoxynaphthalen-2-yl) (oxiran-2-yl)methanol] (see paper)
33% identity, 78% coverage: 46:249/262 of query aligns to 41:243/247 of 4ou1A

query
sites
4ou1A
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
|
E
I
 
Y
K
|
K
K
 
R
A
 
K
S
x
D
P
|
P
S
 
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
A
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
-
A
 
G
V
 
L
S
 
F
I
 
I
L
 
S
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
|
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
T
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
x
Y
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
 
A
L
 
L
I
 
I
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
L
T
 
I
E
x
I
V
 
I
H
 
N
N
 
D
E
 
E
E
 
N
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
F
I
 
I
G
 
G
I
 
I
N
x
A
N
 
A
R
|
R
D
|
D
L
x
W
R
 
E
D
 
T
F
x
G
S
 
E
T
 
I
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
 
A
E
x
K
S
x
E
S
 
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
 
L
I
 
I
G
 
G
E
 
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

3nz1A Crystal structure of kemp elimination catalyst 1a53-2 complexed with transition state analog 5-nitro benzotriazole (see paper)
33% identity, 78% coverage: 46:249/262 of query aligns to 41:243/249 of 3nz1A

query
sites
3nz1A
K
 
K
E
 
R
N
 
N
I
 
I
S
 
T
-
 
A
I
 
I
I
 
I
A
 
A
E
x
A
I
 
Y
K
|
K
K
 
R
A
 
K
S
 
S
P
 
P
S
 
S
K
 
G
G
 
L
V
 
D
I
 
V
R
 
E
E
 
R
D
 
D
F
 
-
N
 
-
P
 
P
V
 
I
K
 
E
I
 
Y
G
 
S
Q
 
K
I
 
F
Y
 
M
E
 
E
N
 
R
I
 
Y
N
 
A
I
 
V
D
 
-
A
 
G
V
 
L
S
x
A
I
 
I
L
 
A
T
 
T
E
 
E
K
 
E
K
 
K
Y
 
Y
F
 
F
L
 
N
G
 
G
K
 
S
N
 
Y
E
 
E
Y
 
T
I
 
L
K
 
R
I
 
K
V
 
I
K
 
A
E
 
S
V
 
S
N
 
V
S
 
S
K
 
I
P
 
P
I
 
I
L
 
L
R
 
M
K
x
W
D
 
D
F
 
F
I
 
I
V
 
V
D
 
K
E
 
E
Y
 
S
Q
 
Q
L
 
I
Y
 
D
E
 
D
A
 
A
K
 
Y
L
 
N
I
 
L
G
 
G
A
 
A
D
 
D
A
 
T
V
 
V
L
 
A
L
 
L
I
 
I
A
 
V
A
 
K
V
 
I
L
 
L
K
 
T
D
 
E
K
 
R
-
 
E
L
 
L
E
 
E
C
 
S
F
 
L
Y
 
L
N
 
E
R
 
Y
T
 
A
L
 
R
E
 
S
L
 
Y
G
 
G
L
 
M
D
 
E
S
 
P
I
 
A
T
 
I
E
x
V
V
 
I
H
 
N
N
 
D
E
 
E
E
 
N
E
 
D
A
 
L
K
 
D
L
 
I
A
 
A
S
 
L
E
 
R
I
 
I
G
 
G
C
 
A
S
 
R
I
 
F
I
 
I
G
x
E
I
 
I
N
x
A
N
 
S
R
 
R
D
 
D
L
 
L
R
 
E
D
 
T
F
 
L
S
 
E
T
 
I
D
 
N
I
 
K
T
 
E
T
 
N
T
 
Q
K
 
R
R
 
K
L
 
L
M
 
I
K
 
S
Y
 
M
V
 
I
P
 
P
R
 
S
D
 
N
R
 
V
I
 
V
I
 
K
V
 
V
S
 
A
E
x
W
S
x
Q
S
 
G
I
 
I
K
 
S
T
 
E
P
 
R
E
 
N
D
 
E
I
 
I
L
 
E
Y
 
E
L
 
L
R
 
R
S
 
K
I
 
L
G
 
G
V
 
V
N
 
N
A
 
A
V
 
F
L
 
G
I
 
I
G
 
G
E
 
S
T
 
S
F
 
L
M
 
M
R
 
R
N
 
N
I
 
P
D
 
E
D
 
K
L
 
I
K
 
K

Query Sequence

>WP_010966437.1 NCBI__GCF_000008765.1:WP_010966437.1
MILDDIVRDKKLQLIEDKKALSLDDIKSKLNSLNLDKRNFKEALEKENISIIAEIKKASP
SKGVIREDFNPVKIGQIYENINIDAVSILTEKKYFLGKNEYIKIVKEVNSKPILRKDFIV
DEYQLYEAKLIGADAVLLIAAVLKDKLECFYNRTLELGLDSITEVHNEEEAKLASEIGCS
IIGINNRDLRDFSTDITTTKRLMKYVPRDRIIVSESSIKTPEDILYLRSIGVNAVLIGET
FMRNIDDLKGINEFLKKAKDNG

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory