SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_003553864.1 NCBI__GCF_000023185.1:WP_003553864.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

4wzzA Crystal structure of an abc transporter solute binding protein (ipr025997) from clostridium phytofermentas (cphy_0583, target efi- 511148) with bound l-rhamnose
42% identity, 91% coverage: 31:331/331 of query aligns to 9:321/321 of 4wzzA

query
sites
4wzzA
L
 
I
V
 
I
V
 
V
K
|
K
S
 
S
L
 
A
G
 
G
N
|
N
G
 
P
F
x
Y
F
 
N
D
 
Q
A
 
K
A
 
E
N
 
S
K
 
E
G
 
G
A
 
Y
Q
 
K
E
 
Q
A
 
V
A
 
I
K
 
E
E
 
A
L
 
N
G
 
G
G
 
G
V
 
K
E
 
C
V
 
V
I
 
I
Y
 
Q
T
 
E
G
 
-
P
 
P
T
 
K
T
 
S
T
 
A
T
 
T
A
 
A
E
 
E
G
 
D
Q
 
Q
I
 
I
E
 
T
V
 
C
I
 
I
N
 
N
S
 
N
L
 
A
I
 
I
A
 
S
Q
 
Q
G
 
G
V
 
V
S
 
D
A
 
C
I
 
I
A
 
A
V
 
I
S
 
A
A
 
A
N
 
N
D
 
D
P
 
T
D
 
D
A
 
A
L
 
L
V
 
E
P
 
P
A
 
A
L
 
L
K
 
T
K
 
E
A
 
A
A
 
K
Q
 
N
R
 
Q
G
 
G
I
 
I
K
 
H
V
 
V
I
 
L
S
 
S
W
 
L
D
|
D
S
 
S
G
 
A
V
 
T
A
 
N
P
 
A
E
 
N
G
 
S
R
 
R
I
 
K
L
 
V
Q
 
F
L
 
V
N
 
N
P
 
Q
S
 
A
S
 
G
N
 
T
E
 
T
L
 
Q
I
 
I
G
 
A
K
 
Q
M
 
A
C
 
L
L
 
M
T
 
D
L
 
A
V
 
I
K
 
L
D
 
D
H
 
-
L
 
I
D
 
S
G
 
G
G
 
G
K
 
S
G
 
G
D
 
D
F
 
W
A
 
A
I
 
V
L
 
L
S
 
S
A
 
A
T
 
A
T
 
S
T
 
T
S
 
A
T
 
T
N
|
N
Q
 
Q
N
 
N
I
 
A
W
 
W
I
 
I
D
 
D
Q
 
G
M
 
M
K
 
K
K
 
T
Q
 
V
L
 
M
K
 
Q
D
 
D
-
 
S
-
 
K
F
 
Y
P
 
S
G
 
K
L
 
L
N
 
N
L
 
L
V
 
I
T
 
G
T
 
V
V
 
Y
Y
 
Y
G
 
G
D
 
D
D
|
D
L
 
E
S
 
Y
D
 
Q
K
 
A
S
 
S
Y
 
C
R
 
D
E
 
Q
A
 
T
E
 
E
G
 
A
L
 
I
L
 
L
K
 
A
A
 
A
N
 
D
P
 
P
N
 
N
I
 
I
K
 
K
V
 
V
I
 
I
V
 
C
A
 
A
P
 
P
T
|
T
T
|
T
V
 
V
G
 
G
V
 
I
L
 
M
A
 
A
A
 
A
S
 
A
K
 
K
V
 
V
V
 
L
E
 
Q
D
 
D
K
 
K
G
 
G
L
 
L
V
 
S
G
 
G
K
 
K
V
 
V
Y
 
K
V
 
L
T
 
T
G
 
G
L
 
L
G
 
G
L
 
L
P
 
P
S
 
S
E
 
E
M
 
M
A
 
A
G
 
D
A
 
Y
I
 
I
-
 
G
-
 
D
-
 
D
K
 
D
S
 
Q
G
 
H
A
 
S
T
 
C
K
 
P
E
 
Y
F
 
M
A
 
F
I
 
L
W
|
W
N
 
N
P
 
P
I
 
I
D
 
Q
L
 
L
G
 
G
Y
 
N
S
 
L
A
 
A
T
 
A
Q
 
Y
I
 
A
A
 
S
Y
 
I
R
 
S
L
 
L
V
 
V
K
 
N
G
 
G
E
 
T
T
 
I
D
 
T
G
 
G
K
 
A
P
 
A
G
 
D
S
 
Q
E
 
S
I
 
F
E
 
T
V
 
V
-
 
P
-
 
D
-
 
K
-
 
T
-
 
L
G
 
G
R
 
D
M
 
N
G
 
G
K
 
S
I
 
Y
K
 
K
V
 
I
-
 
T
-
 
A
-
 
A
G
 
A
D
 
D
N
 
G
G
 
G
-
 
T
E
 
E
A
 
I
A
 
I
M
 
L
A
 
G
D
 
A
P
 
P
F
 
F
V
 
K
Y
 
F
N
 
E
A
 
P
S
 
S
N
 
N
I
 
I
D
 
A
Q
 
E
F
 
W
S
 
A
K
 
K
V
 
V
F
 
Y

1tjyA Crystal structure of salmonella typhimurium ai-2 receptor lsrb in complex with r-thmf (see paper)
32% identity, 91% coverage: 28:327/331 of query aligns to 5:314/316 of 1tjyA

query
sites
1tjyA
K
 
R
I
 
I
G
 
A
L
 
F
V
 
I
V
 
P
K
|
K
S
 
L
L
 
V
G
 
G
N
 
V
G
 
G
F
|
F
F
|
F
D
 
T
A
 
S
A
 
G
N
 
G
K
 
N
G
 
G
A
 
A
Q
 
Q
E
 
E
A
 
A
A
 
G
K
 
K
E
 
A
L
 
L
G
 
G
G
 
-
V
 
I
E
 
D
V
 
V
I
 
T
Y
 
Y
T
 
D
G
 
G
P
 
P
T
 
T
T
 
E
T
 
P
T
 
S
A
 
V
E
 
S
G
 
G
Q
 
Q
I
 
V
E
 
Q
V
 
L
I
 
V
N
 
N
S
 
N
L
 
F
I
 
V
A
 
N
Q
 
Q
G
 
G
V
 
Y
S
 
D
A
 
A
I
 
I
A
 
I
V
 
V
S
 
S
A
 
A
N
 
V
D
 
S
P
 
P
D
 
D
A
 
G
L
 
L
V
 
C
P
 
P
A
 
A
L
 
L
K
 
K
K
 
R
A
 
A
A
 
M
Q
 
Q
R
 
R
G
 
G
I
 
V
K
 
K
V
 
I
I
 
L
S
 
T
W
 
W
D
|
D
S
 
S
G
 
D
V
 
T
A
 
K
P
 
P
E
 
E
G
 
C
R
 
R
I
 
S
L
 
Y
Q
 
Y
L
 
I
N
 
N
P
 
Q
S
 
G
S
 
T
N
 
P
E
 
K
L
 
Q
I
 
L
G
 
G
K
 
S
M
 
M
C
 
L
L
 
V
T
 
E
L
 
M
V
 
A
K
 
A
D
 
H
H
 
Q
L
 
V
D
 
D
G
 
K
G
 
E
K
 
K
G
 
A
D
 
K
F
 
V
A
 
A
I
 
F
L
 
F
S
 
Y
A
 
S
T
 
S
T
 
P
T
 
T
S
 
V
T
 
T
N
x
D
Q
|
Q
N
 
N
I
 
Q
W
|
W
I
 
V
D
 
K
Q
 
E
M
 
A
K
 
K
K
 
A
Q
 
K
L
 
I
-
 
S
K
 
Q
D
 
E
F
 
H
P
 
P
G
 
G
L
 
W
N
 
E
L
 
I
V
 
V
T
 
T
T
 
T
V
 
Q
Y
 
F
G
 
G
D
 
Y
D
 
N
L
 
D
S
 
A
D
 
T
K
 
K
S
 
S
Y
 
L
R
 
Q
E
 
T
A
 
A
E
 
E
G
 
G
L
 
I
L
 
I
K
 
K
A
 
A
N
 
Y
P
 
P
N
 
D
I
 
L
K
 
D
V
 
A
I
 
I
V
 
I
A
 
A
P
|
P
T
x
D
T
x
A
V
 
N
G
 
A
V
 
L
L
 
P
A
 
A
A
 
A
S
 
A
K
 
Q
V
 
A
V
 
A
E
 
E
D
 
N
K
 
L
G
 
K
L
 
R
V
 
-
G
 
N
K
 
N
V
 
L
Y
 
A
V
 
I
T
 
V
G
 
G
L
 
F
G
 
S
L
 
T
P
 
P
S
 
N
E
 
V
M
 
M
A
 
R
G
 
P
A
 
Y
I
 
V
K
 
Q
S
 
R
G
 
G
A
 
T
T
 
V
K
 
K
E
 
E
F
 
F
A
 
G
I
 
L
W
|
W
N
 
D
P
 
V
I
 
V
D
 
Q
L
 
Q
G
 
G
Y
 
K
S
 
I
A
 
S
T
 
V
Q
 
Y
I
 
V
A
 
A
Y
 
N
R
 
A
L
 
L
V
 
L
K
 
K
G
 
-
E
 
N
T
 
M
D
 
P
G
 
M
K
 
N
P
 
V
G
 
G
S
 
D
E
 
S
I
 
L
E
 
D
V
 
I
G
 
P
R
 
G
M
 
I
G
 
G
K
 
K
I
 
V
K
 
T
V
 
V
G
 
S
D
 
P
N
 
N
G
 
S
E
 
E
A
 
Q
A
 
G
-
 
Y
-
 
H
-
 
Y
-
 
E
-
 
A
-
 
K
-
 
G
-
 
N
-
 
G
-
 
I
-
 
V
-
 
L
M
 
L
A
 
P
D
 
E
P
 
R
F
 
V
V
 
I
Y
 
F
N
 
N
A
 
K
S
 
D
N
 
N
I
 
I
D
 
D
Q
 
K
F
 
Y

3t95A Crystal structure of lsrb from yersinia pestis complexed with autoinducer-2 (see paper)
34% identity, 85% coverage: 28:308/331 of query aligns to 3:281/314 of 3t95A

query
sites
3t95A
K
 
R
I
 
I
G
 
A
L
 
F
V
 
I
V
 
P
K
|
K
S
 
L
L
 
V
G
 
G
N
 
V
G
 
G
F
|
F
F
|
F
D
 
T
A
 
S
A
 
G
N
 
G
K
 
K
G
 
G
A
 
A
Q
 
V
E
 
D
A
 
A
A
 
G
K
 
K
E
 
A
L
 
L
G
 
G
G
 
-
V
 
V
E
 
D
V
 
V
I
 
T
Y
 
Y
T
 
D
G
 
G
P
 
P
T
 
T
T
 
E
T
 
P
T
 
S
A
 
V
E
 
S
G
 
G
Q
 
Q
I
 
V
E
 
Q
V
 
L
I
 
I
N
 
N
S
 
N
L
 
F
I
 
V
A
 
N
Q
 
Q
G
 
G
V
 
Y
S
 
N
A
 
A
I
 
I
A
 
V
V
 
V
S
 
S
A
 
A
N
 
V
D
 
S
P
 
P
D
 
D
A
 
G
L
 
L
V
 
C
P
 
P
A
 
A
L
 
L
K
 
K
K
 
R
A
 
A
A
 
M
Q
 
Q
R
 
R
G
 
G
I
 
V
K
 
K
V
 
I
I
 
L
S
 
T
W
 
W
D
|
D
S
 
S
G
 
D
V
 
T
A
 
K
P
 
P
E
 
E
G
 
C
R
 
R
I
 
S
L
 
V
Q
 
Y
L
 
I
N
 
N
P
 
Q
S
 
G
S
 
T
N
 
P
E
 
N
L
 
Q
I
 
L
G
 
G
K
 
S
M
 
M
C
 
L
L
 
V
T
 
D
L
 
M
V
 
A
K
 
A
D
 
N
H
 
Q
L
 
V
D
 
K
G
 
K
G
 
E
K
 
Q
G
 
A
D
 
K
F
 
V
A
 
A
I
 
F
L
 
F
S
 
Y
A
 
S
T
 
S
T
 
P
T
 
T
S
 
V
T
 
T
N
x
D
Q
|
Q
N
 
N
I
 
Q
W
|
W
I
 
V
D
 
N
Q
 
E
M
 
A
K
 
K
K
 
K
Q
 
K
L
 
I
-
 
Q
K
 
Q
D
 
E
F
 
H
P
 
P
G
 
G
L
 
W
N
 
E
L
 
I
V
 
V
T
 
T
T
 
T
V
 
Q
Y
 
F
G
 
G
D
 
Y
D
 
N
L
 
D
S
 
A
D
 
T
K
 
K
S
 
S
Y
 
L
R
 
Q
E
 
T
A
 
A
E
 
E
G
 
G
L
 
I
L
 
L
K
 
K
A
 
A
N
 
Y
P
 
A
N
 
D
I
 
L
K
 
D
V
 
A
I
 
I
V
 
I
A
 
A
P
|
P
T
x
D
T
x
A
V
 
N
G
 
A
V
 
L
L
 
P
A
 
A
A
 
A
S
 
A
K
 
Q
V
 
A
V
 
A
E
 
E
D
 
N
K
 
L
G
 
K
L
 
R
V
 
-
G
 
A
K
 
N
V
 
V
Y
 
A
V
 
I
T
 
V
G
 
G
L
 
F
G
 
S
L
 
T
P
 
P
S
 
N
E
 
V
M
 
M
A
 
R
G
 
P
A
 
Y
I
 
V
K
 
E
S
 
R
G
 
G
A
 
T
T
 
V
K
 
K
E
 
E
F
 
F
A
 
G
I
 
L
W
|
W
N
 
D
P
 
V
I
 
V
D
 
N
L
 
Q
G
 
G
Y
 
K
S
 
I
A
 
S
T
 
V
Q
 
Y
I
 
V
A
 
A
Y
 
N
R
 
E
L
 
M
V
 
L
K
 
K
G
 
-
E
 
K
T
 
G
D
 
D
G
 
L
K
 
N
P
 
V
G
 
G
S
 
D
E
 
K
I
 
I
E
 
D
V
 
I
G
 
P
R
 
N
M
 
I
G
 
G
K
 
V
I
 
V
K
 
E
V
 
V
G
 
S
D
 
P
N
 
N

4pz0A The crystal structure of a solute binding protein from bacillus anthracis str. Ames in complex with quorum-sensing signal autoinducer-2 (ai-2)
30% identity, 92% coverage: 24:328/331 of query aligns to 5:320/321 of 4pz0A

query
sites
4pz0A
A
 
A
A
 
D
D
 
D
I
 
V
K
 
K
I
 
F
G
 
A
L
 
F
V
 
I
V
 
P
K
|
K
S
 
L
L
 
T
G
 
G
N
 
V
G
 
G
F
|
F
F
 
F
D
 
T
A
 
S
A
 
G
N
 
G
K
 
E
G
 
G
A
 
A
Q
 
K
E
 
E
A
 
M
A
 
G
K
 
D
E
 
K
L
 
L
G
 
G
G
 
-
V
 
V
E
 
Q
V
 
V
I
 
K
Y
 
Y
T
 
D
G
 
G
P
 
P
T
 
S
T
 
E
T
 
A
T
 
S
A
 
V
E
 
S
G
 
G
Q
 
Q
I
 
V
E
 
K
V
 
Y
I
 
I
N
 
N
S
 
N
L
 
F
I
 
I
A
 
N
Q
 
Q
G
 
N
V
 
Y
S
 
D
A
 
A
I
 
L
A
 
M
V
 
V
S
 
S
A
 
S
N
 
T
D
 
S
P
 
V
D
 
D
A
 
G
L
 
L
V
 
S
P
 
Q
A
 
S
L
 
L
K
 
Q
K
 
R
A
 
A
A
 
K
Q
 
K
R
 
K
G
 
G
I
 
M
K
 
T
V
 
V
I
 
L
S
 
T
W
 
W
D
|
D
S
 
S
G
 
D
V
 
V
A
 
N
P
 
P
E
 
K
G
 
D
R
 
R
I
 
S
L
 
F
Q
 
Y
L
 
I
N
 
S
P
 
Q
S
 
G
S
 
T
N
 
P
E
 
D
L
 
Q
I
 
L
G
 
A
K
 
N
M
 
L
C
 
L
L
 
I
T
 
E
L
 
M
V
 
T
K
 
S
D
 
K
H
 
Q
L
 
I
D
 
-
G
 
G
G
 
D
K
 
K
G
 
G
D
 
K
F
 
V
A
 
A
I
 
F
L
 
F
S
 
Y
A
 
S
T
 
S
T
 
P
T
 
T
S
 
V
T
 
T
N
x
D
Q
|
Q
N
 
N
I
 
Q
W
|
W
I
 
V
D
 
T
Q
 
K
M
 
A
K
 
K
K
 
E
Q
 
I
L
 
I
K
 
K
D
 
E
-
 
K
F
 
Y
P
 
P
G
 
N
L
 
W
N
 
E
L
 
I
V
 
V
T
 
T
T
 
T
V
 
Q
Y
 
Y
G
 
G
D
 
E
D
 
N
L
 
N
S
 
A
D
 
Q
K
 
K
S
 
S
Y
 
L
R
 
S
E
 
V
A
 
G
E
 
E
G
 
N
L
 
I
L
 
L
K
 
K
A
 
T
N
 
Y
P
 
P
N
 
D
I
 
I
K
 
N
V
 
A
I
 
V
V
 
I
A
 
C
P
|
P
T
x
D
T
x
A
V
 
T
G
 
A
V
 
L
L
 
P
A
 
A
A
 
M
S
 
A
K
 
Q
V
 
A
V
 
A
E
 
E
D
 
N
K
 
L
G
 
K
L
 
M
V
 
D
G
 
K
K
 
K
V
 
V
Y
 
V
V
 
V
T
 
T
G
 
G
L
 
F
G
 
S
L
 
T
P
 
P
S
 
N
E
 
V
M
 
M
A
 
R
G
 
D
A
 
Y
I
 
V
K
 
K
S
 
R
G
 
G
A
 
T
T
 
V
K
 
Q
E
 
Q
F
 
F
A
 
G
I
 
L
W
|
W
N
 
D
P
 
V
I
 
K
D
 
Q
L
 
Q
G
 
G
Y
 
A
S
 
L
A
 
A
T
 
T
Q
 
Y
I
 
V
A
 
A
Y
 
N
R
 
E
L
 
I
V
 
V
K
 
V
G
 
K
E
 
G
T
 
K
D
 
K
G
 
L
K
 
K
P
 
V
G
 
G
S
 
D
E
 
S
I
 
F
E
 
E
V
 
V
G
 
K
R
 
G
M
 
I
G
 
G
K
 
K
I
 
V
K
 
K
V
 
V
G
 
E
D
 
P
-
 
N
-
 
S
-
 
I
-
 
Q
-
 
G
-
 
Y
-
 
D
-
 
Y
-
 
E
-
 
A
-
 
E
-
 
G
N
 
N
G
 
G
E
 
I
A
 
I
A
 
V
M
 
L
A
 
P
D
 
E
P
 
R
F
 
V
V
 
V
Y
 
F
N
 
T
A
 
K
S
 
D
N
 
N
I
 
I
D
 
D
Q
 
K
F
 
Y
S
 
N

3ejwA Crystal structure of the sinorhizobium meliloti ai-2 receptor, smlsrb (see paper)
32% identity, 85% coverage: 28:308/331 of query aligns to 3:282/315 of 3ejwA

query
sites
3ejwA
K
 
Q
I
 
I
G
 
A
L
 
F
V
 
I
V
 
P
K
|
K
S
 
L
L
 
V
G
 
G
N
 
V
G
 
G
F
|
F
F
|
F
D
 
T
A
 
S
A
 
G
N
 
G
K
 
A
G
 
G
A
 
A
Q
 
V
E
 
K
A
 
A
A
 
G
K
 
E
E
 
E
L
 
V
G
 
G
G
 
A
V
 
-
E
 
K
V
 
V
I
 
T
Y
 
Y
T
 
D
G
 
G
P
 
P
T
 
T
T
 
E
T
 
P
T
 
S
A
 
V
E
 
S
G
 
G
Q
 
Q
I
 
V
E
 
Q
V
 
F
I
 
I
N
 
N
S
 
N
L
 
F
I
 
V
A
 
N
Q
 
Q
G
 
G
V
 
Y
S
 
N
A
 
A
I
 
L
A
 
I
V
 
V
S
 
S
A
 
S
N
 
V
D
 
S
P
 
P
D
 
D
A
 
G
L
 
L
V
 
C
P
 
P
A
 
A
L
 
L
K
 
K
K
 
R
A
 
A
A
 
M
Q
 
E
R
 
R
G
 
G
I
 
V
K
 
L
V
 
V
I
 
M
S
 
T
W
 
W
D
|
D
S
 
S
G
 
D
V
 
V
A
 
N
P
 
P
E
 
D
G
 
C
R
 
R
I
 
S
L
 
Y
Q
 
Y
L
 
I
N
 
N
P
 
Q
S
 
G
S
 
T
N
 
P
E
 
E
L
 
Q
I
 
L
G
 
G
K
 
G
M
 
L
C
 
L
L
 
V
T
 
D
L
 
M
V
 
A
K
 
A
D
 
E
H
 
G
L
 
V
D
 
K
G
 
K
G
 
E
K
 
K
G
 
A
D
 
K
F
 
V
A
 
A
I
 
F
L
 
F
S
 
Y
A
 
S
T
 
S
T
 
P
T
 
T
S
 
V
T
 
T
N
x
D
Q
|
Q
N
 
N
-
 
A
I
x
W
W
 
A
I
 
E
D
 
A
Q
 
A
M
 
K
K
 
A
K
 
K
Q
 
I
L
 
A
K
 
K
D
 
E
F
 
H
P
 
P
G
 
G
L
 
W
N
 
E
L
 
I
V
 
V
T
 
T
T
 
T
V
 
Q
Y
 
Y
G
 
G
D
 
Y
D
 
N
L
 
D
S
 
A
D
 
Q
K
 
K
S
 
S
Y
 
L
R
 
Q
E
 
T
A
 
A
E
 
E
G
 
S
L
 
I
L
 
L
K
 
Q
A
 
T
N
 
Y
P
 
P
N
 
D
I
 
L
K
 
D
V
 
A
I
 
I
V
 
I
A
 
A
P
|
P
T
x
D
T
x
A
V
 
N
G
 
A
V
 
L
L
 
P
A
 
A
A
 
A
S
 
A
K
 
Q
V
 
A
V
 
A
E
 
E
D
 
N
K
 
L
G
 
K
L
 
R
V
 
A
G
 
E
K
 
G
V
 
V
Y
 
T
V
 
I
T
 
V
G
 
G
L
 
F
G
 
S
L
 
T
P
 
P
S
 
N
E
 
V
M
 
M
A
 
R
G
 
P
A
 
Y
I
 
I
K
 
E
S
 
R
G
 
G
A
 
T
T
 
I
K
 
Q
E
 
R
F
 
F
A
 
G
I
 
L
W
|
W
N
 
D
P
 
V
I
 
T
D
 
Q
L
 
Q
G
 
G
Y
 
K
S
 
I
A
 
S
T
 
V
Q
 
F
I
 
V
A
 
A
Y
 
D
R
 
H
L
 
V
V
 
L
K
 
K
G
 
-
E
 
N
T
 
G
D
 
P
G
 
M
K
 
K
P
 
V
G
 
G
S
 
E
E
 
K
I
 
L
E
 
E
V
 
I
G
 
P
R
 
G
M
 
V
G
 
G
K
 
T
I
 
V
K
 
E
V
 
V
G
 
S
D
 
A
N
 
N

5hqjA Crystal structure of abc transporter solute binding protein b1g1h7 from burkholderia graminis c4d1m, target efi-511179, in complex with d-arabinose
30% identity, 83% coverage: 24:298/331 of query aligns to 4:275/289 of 5hqjA

query
sites
5hqjA
A
 
A
A
 
K
D
 
D
I
 
I
K
 
S
I
 
V
G
 
A
L
 
V
V
 
I
V
 
P
K
|
K
S
 
-
L
 
V
G
 
A
N
 
V
G
 
P
F
|
F
F
 
F
D
 
D
A
 
D
A
 
C
N
 
N
K
 
K
G
 
G
A
 
A
Q
 
K
E
 
T
A
 
A
A
 
A
K
 
D
E
 
K
L
 
-
G
 
A
G
 
G
V
 
V
E
 
K
V
 
Y
I
 
Q
Y
 
W
T
 
V
G
 
V
P
 
P
T
 
Q
T
 
N
T
 
T
T
 
Q
A
 
G
E
 
S
G
 
T
Q
 
Q
I
 
V
E
 
Q
V
 
I
I
 
I
N
 
E
S
 
D
L
 
L
I
 
I
A
 
S
Q
 
R
G
 
H
V
 
V
S
 
D
A
 
G
I
 
I
A
 
A
V
 
I
S
 
S
A
 
V
N
 
N
D
 
E
P
 
P
D
 
K
A
 
S
L
 
V
V
 
E
P
 
S
A
 
V
L
 
M
K
 
K
K
 
R
A
 
A
A
 
E
Q
 
Q
R
 
S
G
 
G
I
 
I
K
 
K
V
 
V
I
 
L
S
 
T
W
 
Y
D
|
D
S
 
S
G
 
D
V
 
S
A
 
P
P
 
K
E
 
S
G
 
G
R
 
R
I
 
S
L
 
M
Q
 
Y
L
 
I
N
 
G
P
 
T
S
 
N
S
 
N
N
 
E
E
 
Q
L
 
A
I
 
G
G
 
A
K
 
T
M
 
M
C
 
A
L
 
E
T
 
T
L
 
M
V
 
G
K
 
K
D
 
A
H
 
L
L
 
-
D
 
-
G
 
N
G
 
G
K
 
Q
G
 
G
D
 
E
F
 
V
A
 
A
I
 
I
L
 
I
S
 
T
A
 
G
T
 
Q
T
 
L
T
 
G
S
 
A
T
 
V
N
|
N
Q
 
L
N
 
N
I
 
E
W
x
R
I
 
I
D
 
A
Q
 
G
M
 
I
K
 
K
K
 
K
Q
 
G
L
 
L
K
 
A
D
 
K
F
 
Y
P
 
P
G
 
G
L
 
I
N
 
K
L
 
V
V
 
V
T
 
E
T
 
T
V
 
Q
Y
 
G
G
 
T
D
 
D
D
 
D
L
 
D
S
 
L
D
 
A
K
 
R
S
 
G
Y
 
V
R
 
S
E
 
V
A
 
V
E
 
E
G
 
T
L
 
T
L
 
L
K
 
R
A
 
A
N
 
H
P
 
P
N
 
N
I
 
L
K
 
K
V
 
G
I
 
I
V
 
F
A
 
G
P
 
V
T
x
S
T
x
Q
V
 
V
G
 
G
V
 
G
L
 
P
A
 
A
A
 
V
S
 
A
K
 
K
V
 
V
V
 
L
E
 
N
D
 
T
K
 
R
-
 
E
-
 
F
-
 
G
G
 
A
L
 
M
V
 
K
G
 
G
K
 
K
V
 
L
Y
 
E
V
 
V
T
 
L
G
 
A
L
 
F
-
x
D
G
 
D
L
 
L
P
 
P
S
 
D
E
 
T
M
 
L
A
 
K
G
 
G
A
 
-
I
 
L
K
 
K
S
 
D
G
 
G
A
 
Y
T
 
I
K
 
Q
E
 
G
F
 
I
A
 
M
I
 
V
W
x
Q
N
 
R
P
 
P
I
 
V
D
 
T
L
 
M
G
 
G
Y
 
S
S
 
L
A
 
A
T
 
V
Q
 
D
I
 
H
A
 
L
Y
 
V
R
 
A
L
 
Q
V
 
I
K
 
Q
G
 
G
E
 
Q
T
 
-
D
 
E
G
 
G
K
 
Q
P
 
P
G
 
-
S
 
K
E
 
D
I
 
I
E
 
D
V
 
T
G
 
G

6dspA Lsrb from clostridium saccharobutylicum in complex with ai-2 (see paper)
28% identity, 85% coverage: 27:308/331 of query aligns to 1:291/326 of 6dspA

query
sites
6dspA
I
 
V
K
 
T
I
 
V
G
 
T
L
 
F
V
 
I
V
 
P
K
|
K
S
 
L
L
 
T
G
 
G
N
 
N
G
 
A
F
|
F
F
|
F
D
 
E
A
 
S
A
 
A
N
 
N
K
 
K
G
 
G
A
 
A
Q
 
Q
E
 
K
A
 
Y
A
 
S
K
 
E
E
 
Q
L
 
W
G
 
G
G
 
-
V
 
F
E
 
K
V
 
V
I
 
D
Y
 
Y
T
 
E
G
 
G
P
 
D
T
 
A
T
 
N
T
 
A
T
 
S
A
 
A
E
 
A
G
 
S
Q
 
Q
I
 
V
E
 
S
V
 
V
I
 
I
N
 
N
S
 
K
L
 
A
I
 
V
A
 
Q
Q
 
Q
G
 
G
V
 
T
S
 
N
A
 
A
I
 
I
A
 
C
V
 
L
S
 
S
A
 
S
N
 
V
D
 
D
P
 
A
D
 
A
A
 
G
L
 
V
V
 
K
P
 
D
A
 
A
L
 
L
K
 
K
K
 
A
A
 
A
A
 
A
Q
 
D
R
 
A
G
 
G
I
 
V
K
 
T
V
 
V
I
 
T
S
 
T
W
 
W
D
|
D
S
 
S
G
 
D
V
 
V
A
 
D
P
 
P
E
 
S
G
 
V
R
 
R
I
 
K
L
 
V
Q
 
M
L
 
V
N
 
S
P
 
Q
S
 
G
S
 
T
N
 
P
E
 
E
L
 
Q
I
 
L
G
 
G
K
 
Q
M
 
M
C
 
L
L
 
V
T
 
Q
L
 
M
V
 
G
K
 
Y
D
 
D
H
 
S
L
 
L
D
 
K
G
 
E
G
 
R
K
 
G
G
 
K
D
 
D
-
 
P
-
 
E
-
 
K
-
 
D
-
 
A
-
 
I
-
 
K
F
 
Y
A
 
C
I
 
W
L
 
H
S
 
Y
A
 
S
T
 
N
T
 
A
T
 
T
S
 
V
T
 
T
N
x
D
Q
|
Q
N
 
N
I
 
S
W
|
W
I
 
Q
D
 
V
Q
 
E
M
 
G
K
 
E
K
 
K
Q
 
Y
L
 
I
K
 
K
D
 
S
-
 
K
F
 
Y
P
 
P
G
 
N
L
 
W
N
 
Q
L
 
N
V
 
V
T
 
A
-
 
P
-
 
D
T
 
N
V
 
Y
Y
 
Y
G
 
S
D
 
N
D
 
Q
L
 
D
S
 
A
D
 
E
K
 
Q
S
 
A
Y
 
I
R
 
S
E
 
V
A
 
G
E
 
E
G
 
S
L
 
I
L
 
L
K
 
S
A
 
A
N
 
H
P
 
S
N
 
D
I
 
I
K
 
D
V
 
L
I
 
I
V
 
I
A
 
C
P
 
N
T
x
D
T
x
S
V
 
T
G
 
A
V
 
L
L
 
P
A
 
G
A
 
Q
S
 
A
K
 
Q
V
 
A
V
 
A
E
 
Q
D
 
N
K
 
K
G
 
G
L
 
L
V
 
T
G
 
A
K
 
K
-
 
N
V
 
V
Y
 
T
V
 
I
T
 
T
G
 
G
L
 
F
G
 
A
L
 
S
P
 
P
S
 
N
E
 
S
M
 
M
A
 
K
G
 
Q
A
 
Y
I
 
C
K
 
N
S
 
D
G
 
G
A
 
I
T
 
L
K
 
T
E
 
R
F
 
W
A
 
G
I
 
L
W
|
W
N
 
D
P
 
C
I
 
G
D
 
I
L
 
Q
G
 
G
Y
 
A
S
 
M
A
 
G
T
 
C
Q
 
Y
I
 
M
A
 
A
Y
 
Y
R
 
Y
L
 
I
V
 
A
K
 
S
G
 
G
E
 
N
T
 
S
D
 
-
G
 
V
K
 
K
P
 
V
G
 
G
S
 
D
E
 
K
I
 
I
E
 
E
V
 
I
G
 
P
R
 
T
M
 
V
G
 
G
K
 
T
I
 
V
K
 
E
V
 
V
G
 
M
D
 
P
N
 
N

2h3hA Crystal structure of the liganded form of thermotoga maritima glucose binding protein (see paper)
26% identity, 78% coverage: 27:284/331 of query aligns to 2:254/313 of 2h3hA

query
sites
2h3hA
I
 
L
K
 
T
I
 
I
G
 
G
L
 
V
V
 
I
V
 
G
K
|
K
S
 
S
L
 
V
G
 
-
N
 
H
G
 
P
F
 
Y
F
 
W
D
 
S
A
 
Q
A
 
V
N
 
E
K
 
Q
G
 
G
A
 
V
Q
 
K
E
 
A
A
 
A
A
 
G
K
 
K
E
 
A
L
 
L
G
 
G
G
 
-
V
 
V
E
 
D
V
 
T
I
 
K
Y
 
F
T
 
F
G
 
V
P
 
P
T
 
Q
T
 
K
T
 
E
T
 
D
A
 
I
E
 
N
G
 
A
Q
 
Q
I
 
L
E
 
Q
V
 
M
I
 
L
N
 
E
S
 
S
L
 
F
I
 
I
A
 
A
Q
 
E
G
 
G
V
 
V
S
 
N
A
 
G
I
 
I
A
 
A
V
 
I
S
 
A
A
 
P
N
 
S
D
 
D
P
 
P
D
 
T
A
 
A
L
 
V
V
 
I
P
 
P
A
 
T
L
 
I
K
 
K
K
 
K
A
 
A
A
 
L
Q
 
E
R
 
M
G
 
G
I
 
I
K
 
P
V
 
V
I
 
V
S
 
T
W
 
L
D
|
D
S
 
T
G
 
D
V
 
S
A
 
P
P
 
D
E
 
S
G
 
G
R
 
R
I
 
Y
L
 
V
Q
 
Y
L
 
I
N
 
G
P
 
-
S
 
T
S
 
D
N
 
N
E
 
Y
L
 
Q
I
 
A
G
 
G
K
 
Y
M
 
T
C
 
A
L
 
G
T
 
L
L
 
I
V
 
M
K
 
K
D
 
E
H
 
L
L
 
L
D
 
-
G
 
G
G
 
G
K
 
K
G
 
G
D
 
K
F
 
V
A
 
V
I
 
I
L
 
G
S
 
T
A
 
G
T
 
S
T
 
L
T
 
T
S
 
A
T
 
M
N
|
N
Q
 
S
N
 
L
I
 
Q
W
x
R
I
 
I
D
 
Q
Q
 
G
M
 
F
K
 
K
K
 
D
Q
 
A
L
 
I
K
 
K
D
 
D
F
 
-
P
 
S
G
 
E
L
 
I
N
 
E
L
 
I
V
 
V
T
 
D
T
 
I
V
 
L
Y
 
N
G
 
D
D
 
E
D
x
E
L
 
D
S
 
G
D
 
A
K
 
R
S
 
A
Y
 
V
R
 
S
E
 
L
A
 
A
E
 
E
G
 
A
L
 
A
L
 
L
K
 
N
A
 
A
N
 
H
P
 
P
N
 
D
I
 
L
K
 
D
V
 
A
I
 
F
V
 
F
A
 
G
P
 
V
T
x
Y
T
x
A
V
 
Y
G
 
N
V
 
G
L
 
P
A
 
A
A
 
Q
S
 
A
K
 
L
V
 
V
V
 
V
E
 
K
D
 
N
K
 
A
G
 
G
L
 
K
V
 
V
G
 
G
K
 
K
V
 
V
Y
 
K
V
 
I
T
 
V
G
 
C
L
 
F
G
x
D
L
 
T
P
 
T
S
 
P
E
 
D
M
 
I
A
 
L
G
 
Q
A
 
Y
I
 
V
K
 
K
S
 
E
G
 
G
A
 
V
T
 
I
K
 
Q
E
 
A
F
 
T
A
 
M
I
 
G
W
x
Q
N
 
R
P
 
P
I
 
Y
D
 
M
L
 
M
G
 
G
Y
 
Y
S
 
L
A
 
S
T
 
V
Q
 
T
I
 
V
A
 
L
Y
 
Y
R
 
L
L
 
M
V
 
N
K
 
K

3c6qC Apo and ligand-bound form of a thermophilic glucose/xylose binding protein
27% identity, 78% coverage: 27:284/331 of query aligns to 2:254/305 of 3c6qC

query
sites
3c6qC
I
 
L
K
 
T
I
 
I
G
 
G
L
 
V
V
 
I
V
 
G
K
|
K
S
 
S
L
 
V
G
 
-
N
 
H
G
 
P
F
 
Y
F
x
W
D
 
S
A
 
Q
A
 
V
N
 
E
K
 
Q
G
 
G
A
 
V
Q
 
K
E
 
A
A
 
A
A
 
G
K
 
K
E
 
A
L
 
L
G
 
G
G
 
-
V
 
V
E
 
D
V
 
T
I
 
K
Y
 
F
T
 
F
G
 
V
P
 
P
T
 
Q
T
 
K
T
 
C
T
 
D
A
 
I
E
 
N
G
 
A
Q
 
Q
I
 
L
E
 
Q
V
 
M
I
 
L
N
 
E
S
 
S
L
 
F
I
 
I
A
 
A
Q
 
E
G
 
G
V
 
V
S
 
N
A
 
G
I
 
I
A
 
A
V
 
I
S
 
A
A
 
P
N
 
S
D
 
D
P
 
P
D
 
T
A
 
A
L
 
V
V
 
I
P
 
P
A
 
T
L
 
I
K
 
K
K
 
K
A
 
A
A
 
L
Q
 
E
R
 
M
G
 
G
I
 
I
K
 
P
V
 
V
I
 
V
S
 
T
W
 
L
D
|
D
S
 
T
G
 
D
V
 
S
A
 
P
P
 
D
E
 
S
G
 
G
R
 
R
I
 
Y
L
 
V
Q
 
Y
L
 
I
N
 
G
P
 
-
S
 
T
S
 
D
N
 
N
E
 
Y
L
 
Q
I
 
A
G
 
G
K
 
Y
M
 
T
C
 
A
L
 
G
T
 
L
L
 
I
V
 
M
K
 
K
D
 
E
H
 
L
L
 
L
D
 
-
G
 
G
G
 
G
K
 
K
G
 
G
D
 
K
F
 
V
A
 
V
I
 
I
L
 
G
S
 
T
A
 
G
T
 
S
T
 
L
T
 
T
S
 
A
T
 
M
N
|
N
Q
 
S
N
 
L
I
 
Q
W
x
R
I
 
I
D
 
Q
Q
 
G
M
 
F
K
 
K
K
 
D
Q
 
A
L
 
I
K
 
K
D
 
D
F
 
-
P
 
S
G
 
E
L
 
I
N
 
E
L
 
I
V
 
V
T
 
D
T
 
I
V
 
L
Y
 
-
G
 
-
D
 
N
D
 
D
L
 
C
S
x
E
D
 
D
-
 
G
-
 
A
K
 
R
S
 
A
Y
 
V
R
 
S
E
 
L
A
 
A
E
 
E
G
 
A
L
 
A
L
 
L
K
 
N
A
 
A
N
 
H
P
 
P
N
 
D
I
 
L
K
 
D
V
 
A
I
 
F
V
 
F
A
 
G
P
 
V
T
x
Y
T
x
A
V
 
Y
G
 
N
V
 
G
L
 
P
A
 
A
A
 
Q
S
 
A
K
 
L
V
 
V
V
 
V
E
 
K
D
 
N
K
 
A
G
 
G
L
 
K
V
 
V
G
 
G
K
 
K
V
 
V
Y
 
K
V
 
I
T
 
V
G
 
C
L
 
F
G
x
D
L
 
T
P
 
T
S
 
P
E
 
D
M
 
I
A
 
L
G
 
Q
A
 
Y
I
 
V
K
 
K
S
 
E
G
 
G
A
 
V
T
 
I
K
 
Q
E
 
A
F
 
T
A
 
M
I
 
G
W
x
Q
N
 
R
P
 
P
I
 
Y
D
 
M
L
 
M
G
 
G
Y
 
Y
S
 
L
A
 
S
T
 
V
Q
 
T
I
 
V
A
 
L
Y
 
Y
R
 
L
L
 
M
V
 
N
K
 
K

5dteB Crystal structure of an abc transporter periplasmic solute binding protein (ipr025997) from actinobacillus succinogenes 130z(asuc_0081, target efi-511065) with bound d-allose
27% identity, 67% coverage: 28:248/331 of query aligns to 4:229/287 of 5dteB

query
sites
5dteB
K
 
Q
I
 
I
G
 
A
L
 
L
V
 
L
V
 
M
K
|
K
S
 
T
L
 
L
G
 
S
N
|
N
G
 
E
F
x
Y
F
 
F
D
 
I
A
 
S
A
 
M
N
 
R
K
 
Q
G
 
G
A
 
A
Q
 
E
E
 
E
A
 
T
A
 
A
K
 
K
E
 
Q
L
 
K
G
 
D
G
 
I
V
 
D
E
 
L
V
 
I
I
 
V
Y
 
Q
T
 
V
G
 
A
P
 
E
T
 
K
T
 
E
T
 
D
T
 
S
A
 
T
E
 
E
G
 
Q
Q
 
L
I
 
V
E
 
G
V
 
L
I
 
V
N
 
E
S
 
N
L
 
M
I
 
I
A
 
A
Q
 
K
G
 
K
V
 
V
S
 
D
A
 
A
I
 
I
A
 
I
V
 
V
S
 
T
A
 
P
N
 
N
D
 
D
P
 
S
D
 
I
A
 
A
L
 
F
V
 
I
P
 
P
A
 
A
L
 
F
K
 
Q
K
 
K
A
 
A
A
 
E
Q
 
K
R
 
A
G
 
G
I
 
I
K
 
P
V
 
I
I
 
I
S
 
D
W
 
L
D
|
D
S
 
-
G
 
-
V
 
-
A
 
-
P
 
-
E
 
-
G
 
-
R
 
-
I
 
-
L
 
V
Q
 
R
L
 
L
N
 
D
P
 
A
S
 
K
S
 
A
N
 
A
E
 
E
L
 
A
I
 
A
G
 
G
K
 
L
M
 
K
C
 
F
L
 
N
T
 
Y
L
 
V
V
 
G
K
 
V
D
 
D
H
 
N
L
 
F
D
 
N
G
 
G
G
 
G
-
 
Y
-
 
L
-
 
E
-
 
A
-
 
K
-
 
N
-
 
L
-
 
A
-
 
E
-
 
A
-
 
I
-
 
G
-
 
K
K
 
K
G
 
G
D
 
N
F
 
V
A
 
A
I
 
I
L
 
L
S
 
E
A
 
G
T
 
I
T
 
P
T
 
G
S
 
V
T
 
D
N
|
N
Q
 
G
N
 
E
I
 
Q
W
x
R
I
 
K
D
 
G
Q
 
G
M
 
A
K
 
L
K
 
K
Q
 
A
L
 
F
K
 
A
D
 
E
F
 
Y
P
 
P
G
 
D
L
 
I
N
 
K
L
 
I
V
 
V
T
 
A
T
 
S
V
 
Q
Y
 
S
G
 
A
D
 
N
D
x
W
L
 
E
S
 
T
D
 
E
K
 
Q
S
 
A
Y
 
L
R
 
N
E
 
V
A
 
T
E
 
T
G
 
N
L
 
I
L
 
L
K
 
T
A
 
A
N
 
N
P
 
P
N
 
N
I
 
I
K
 
N
V
 
G
I
 
I
V
 
F
A
 
A
P
 
A
T
 
N
T
 
D
V
 
N
G
 
M
V
 
A
L
 
I
A
 
G
A
 
A
S
 
V
K
 
T
V
 
A
V
 
V
E
 
E
D
 
N
K
 
A
G
 
G
L
 
L
V
 
A
G
 
G
K
 
K
V
 
V
Y
 
L
V
 
V
T
 
S
G
 
G
L
 
Y
-
x
D
G
 
G
L
 
I
P
 
P

Sites not aligning to the query:

6guqA Crystal structure of ganp, a glucose-galactose binding protein from geobacillus stearothermophilus, in complex with glucose
23% identity, 77% coverage: 31:286/331 of query aligns to 6:258/278 of 6guqA

query
sites
6guqA
L
 
L
V
 
V
V
 
P
K
x
E
S
 
E
L
 
L
G
 
D
N
|
N
G
 
D
F
x
Y
F
 
W
D
 
R
A
 
L
A
 
V
N
 
E
K
 
K
G
 
G
A
 
A
Q
 
K
E
 
A
A
 
A
A
 
A
K
 
K
E
 
E
L
 
L
G
 
G
G
 
-
V
 
V
E
 
D
V
 
L
I
 
E
Y
 
Y
T
 
I
G
 
G
P
 
P
T
 
R
T
 
Q
T
 
A
T
 
N
A
 
I
E
 
D
G
 
E
Q
 
H
I
 
L
E
 
R
V
 
I
I
 
L
N
 
K
S
 
K
L
 
A
I
 
A
A
 
A
Q
 
A
G
 
K
V
 
V
S
 
D
A
 
G
I
 
I
A
 
I
V
 
T
S
 
Q
A
 
G
N
 
L
D
 
T
P
 
E
D
 
A
A
 
E
L
 
F
V
 
V
P
 
P
A
 
V
L
 
I
K
 
N
K
 
E
A
 
I
A
 
T
Q
 
D
R
 
K
G
 
N
I
 
I
K
 
P
V
 
V
I
 
V
S
 
T
W
 
I
D
|
D
S
 
T
G
 
D
V
 
-
A
 
A
P
 
P
E
 
T
G
 
S
R
 
R
I
 
R
L
 
V
Q
 
A
L
 
Y
N
 
V
P
 
G
S
 
T
S
 
D
N
 
N
E
 
Y
L
 
Y
I
 
A
G
 
G
K
 
F
M
 
L
C
 
A
-
 
G
L
 
R
T
 
A
L
 
L
V
 
A
K
 
E
D
 
D
H
 
-
L
 
-
D
 
T
G
 
K
G
 
G
K
 
K
G
 
A
D
 
T
F
 
V
A
 
A
I
 
I
L
 
I
S
 
T
A
 
G
T
 
S
T
 
L
T
 
T
S
 
A
T
 
A
N
x
H
Q
 
Q
N
 
Q
I
 
L
W
x
R
I
 
V
D
 
R
Q
 
G
M
 
F
K
 
E
K
 
D
Q
 
A
L
 
V
K
 
R
D
 
Q
F
 
E
P
 
K
G
 
G
L
 
I
N
 
R
L
 
I
V
 
V
T
 
A
T
 
I
V
 
E
Y
 
E
G
 
S
D
 
H
D
x
I
L
 
T
S
 
R
D
 
V
K
 
Q
S
 
A
Y
 
A
R
 
E
E
 
K
A
 
A
E
 
Y
G
 
T
L
 
I
L
 
L
K
 
K
A
 
K
N
 
H
P
 
P
N
 
D
I
 
V
K
 
N
V
 
A
I
 
F
V
 
Y
A
 
G
P
 
T
T
x
S
T
x
A
V
 
L
G
 
D
V
 
A
L
 
I
A
 
G
A
 
V
S
 
A
K
 
K
V
 
V
V
 
V
E
 
E
D
 
Q
K
 
F
G
 
H
L
 
R
V
 
E
G
 
Q
K
 
K
V
 
T
Y
 
Y
V
 
I
T
 
I
G
 
G
L
 
F
G
x
D
L
 
T
P
 
L
S
 
P
E
 
E
M
 
T
A
 
I
G
 
R
A
 
Y
I
 
L
K
 
Q
S
 
K
G
 
G
A
 
T
T
 
I
K
 
A
E
 
A
F
 
T
A
 
V
I
 
V
W
x
Q
N
 
E
P
 
P
I
 
Y
D
 
E
L
 
M
G
 
G
Y
 
Y
S
 
K
A
 
A
T
 
V
Q
 
K
I
 
M
A
 
M
Y
 
A
R
 
E
L
 
I
V
 
V
K
 
A
G
 
G
E
 
K

6gt9A Crystal structure of ganp, a glucose-galactose binding protein from geobacillus stearothermophilus, in complex with galactose
23% identity, 77% coverage: 31:286/331 of query aligns to 11:263/283 of 6gt9A

query
sites
6gt9A
L
 
L
V
 
V
V
 
P
K
x
E
S
 
E
L
 
L
G
 
D
N
|
N
G
 
D
F
x
Y
F
x
W
D
 
R
A
 
L
A
 
V
N
 
E
K
 
K
G
 
G
A
 
A
Q
 
K
E
 
A
A
 
A
A
 
A
K
 
K
E
 
E
L
 
L
G
 
G
G
 
-
V
 
V
E
 
D
V
 
L
I
 
E
Y
 
Y
T
 
I
G
 
G
P
 
P
T
 
R
T
 
Q
T
 
A
T
 
N
A
 
I
E
 
D
G
 
E
Q
 
H
I
 
L
E
 
R
V
 
I
I
 
L
N
 
K
S
 
K
L
 
A
I
 
A
A
 
A
Q
 
A
G
 
K
V
 
V
S
 
D
A
 
G
I
 
I
A
 
I
V
 
T
S
 
Q
A
 
G
N
 
L
D
 
T
P
 
E
D
 
A
A
 
E
L
 
F
V
 
V
P
 
P
A
 
V
L
 
I
K
 
N
K
 
E
A
 
I
A
 
T
Q
 
D
R
 
K
G
 
N
I
 
I
K
 
P
V
 
V
I
 
V
S
 
T
W
 
I
D
|
D
S
 
T
G
 
D
V
 
-
A
 
A
P
 
P
E
 
T
G
 
S
R
 
R
I
 
R
L
 
V
Q
 
A
L
 
Y
N
 
V
P
 
G
S
 
T
S
 
D
N
 
N
E
 
Y
L
 
Y
I
 
A
G
 
G
K
 
F
M
 
L
C
 
A
-
 
G
L
 
R
T
 
A
L
 
L
V
 
A
K
 
E
D
 
D
H
 
-
L
 
-
D
 
T
G
 
K
G
 
G
K
 
K
G
 
A
D
 
T
F
 
V
A
 
A
I
 
I
L
 
I
S
 
T
A
 
G
T
 
S
T
 
L
T
 
T
S
 
A
T
 
A
N
x
H
Q
 
Q
N
 
Q
I
 
L
W
x
R
I
 
V
D
 
R
Q
 
G
M
 
F
K
 
E
K
 
D
Q
 
A
L
 
V
K
 
R
D
 
Q
F
 
E
P
 
K
G
 
G
L
 
I
N
 
R
L
 
I
V
 
V
T
 
A
T
 
I
V
 
E
Y
 
E
G
 
S
D
 
H
D
x
I
L
 
T
S
 
R
D
 
V
K
 
Q
S
 
A
Y
 
A
R
 
E
E
 
K
A
 
A
E
 
Y
G
 
T
L
 
I
L
 
L
K
 
K
A
 
K
N
 
H
P
 
P
N
 
D
I
 
V
K
 
N
V
 
A
I
 
F
V
 
Y
A
 
G
P
 
T
T
x
S
T
x
A
V
 
L
G
 
D
V
 
A
L
 
I
A
 
G
A
 
V
S
 
A
K
 
K
V
 
V
V
 
V
E
 
E
D
 
Q
K
 
F
G
 
H
L
 
R
V
 
E
G
 
Q
K
 
K
V
 
T
Y
 
Y
V
 
I
T
 
I
G
 
G
L
 
F
G
x
D
L
 
T
P
 
L
S
 
P
E
 
E
M
 
T
A
 
I
G
 
R
A
 
Y
I
 
L
K
 
Q
S
 
K
G
 
G
A
 
T
T
 
I
K
 
A
E
 
A
F
 
T
A
 
V
I
 
V
W
x
Q
N
 
E
P
 
P
I
 
Y
D
 
E
L
 
M
G
 
G
Y
 
Y
S
 
K
A
 
A
T
 
V
Q
 
K
I
 
M
A
 
M
Y
 
A
R
 
E
L
 
I
V
 
V
K
 
A
G
 
G
E
 
K

2ioyA Crystal structure of thermoanaerobacter tengcongensis ribose binding protein (see paper)
27% identity, 78% coverage: 29:286/331 of query aligns to 3:255/274 of 2ioyA

query
sites
2ioyA
I
 
I
G
 
G
L
 
L
V
 
V
V
 
I
K
 
S
S
 
T
L
 
L
G
 
N
N
|
N
G
 
P
F
|
F
F
|
F
D
 
V
A
 
T
A
 
L
N
 
K
K
 
N
G
 
G
A
 
A
Q
 
E
E
 
E
A
 
K
A
 
A
K
 
K
E
 
E
L
 
L
G
 
G
G
 
Y
V
 
K
E
 
I
V
 
I
I
 
V
Y
 
E
T
 
D
G
 
S
P
 
Q
T
 
N
T
 
D
T
 
S
T
 
S
A
 
K
E
 
E
G
 
-
Q
 
-
I
 
L
E
 
S
V
 
N
I
 
V
N
 
E
S
 
D
L
 
L
I
 
I
A
 
Q
Q
 
Q
G
 
K
V
 
V
S
 
D
A
 
V
I
 
L
A
 
L
V
 
I
S
 
N
A
 
P
N
 
V
D
 
D
P
 
S
D
 
D
A
 
A
L
 
V
V
 
V
P
 
T
A
 
A
L
 
I
K
 
K
K
 
E
A
 
A
A
 
N
Q
 
S
R
 
K
G
 
N
I
 
I
K
 
P
V
 
V
I
 
I
S
 
T
W
 
I
D
|
D
S
x
R
G
 
S
V
 
-
A
 
A
P
 
N
E
 
G
G
 
G
R
 
D
I
 
V
L
 
V
Q
 
C
L
 
H
N
 
I
P
 
A
S
 
S
S
 
D
N
 
N
E
 
V
L
 
K
I
 
G
G
 
G
K
 
E
M
 
M
C
 
A
L
 
A
T
 
E
L
 
F
V
 
I
K
 
A
D
 
K
H
 
A
L
 
L
D
 
K
G
 
-
G
 
G
K
 
K
G
 
G
D
 
N
F
 
V
A
 
V
I
 
E
L
 
L
S
 
E
A
 
G
T
 
I
T
 
P
T
 
G
S
 
A
T
 
S
N
x
A
Q
 
A
N
 
R
I
 
D
W
x
R
I
 
G
D
 
K
Q
 
G
M
 
F
K
 
D
K
 
E
Q
 
A
L
 
I
K
 
A
D
 
K
F
 
Y
P
 
P
G
 
D
L
 
I
N
 
K
L
 
I
V
 
V
T
 
A
T
 
K
V
 
Q
Y
 
A
G
 
A
D
 
D
D
x
F
L
 
D
S
 
R
D
 
S
K
 
K
S
 
G
Y
 
L
R
 
S
E
 
V
A
 
M
E
 
E
G
 
N
L
 
I
L
 
L
K
 
Q
A
 
A
N
 
Q
P
 
P
N
 
K
I
 
I
K
 
D
V
 
A
I
 
V
V
 
F
A
 
A
P
 
Q
T
x
N
T
 
D
V
 
E
G
 
M
V
 
A
L
 
L
A
 
G
A
 
A
S
 
I
K
 
K
V
 
A
V
 
I
E
 
E
D
 
A
K
 
A
G
 
N
L
 
R
V
 
Q
G
 
G
K
 
-
V
 
I
Y
 
I
V
 
V
T
 
V
G
 
G
L
 
F
G
x
D
L
 
G
P
 
T
S
 
E
E
 
D
M
 
A
A
 
L
G
 
K
A
 
A
I
 
I
K
 
K
S
 
E
G
 
G
A
 
K
T
 
M
K
 
A
E
 
A
F
 
T
A
 
I
I
 
A
W
x
Q
N
 
Q
P
 
P
I
 
A
D
 
L
L
 
M
G
 
G
Y
 
S
S
 
L
A
 
G
T
 
V
Q
 
E
I
 
M
A
 
A
Y
 
D
R
 
K
L
 
Y
V
 
L
K
 
K
G
 
G
E
 
E

4ry9B Crystal structure of carbohydrate transporter solute binding protein veis_2079 from verminephrobacter eiseniae ef01-2, target efi-511009, a complex with d-talitol
25% identity, 80% coverage: 27:291/331 of query aligns to 3:272/297 of 4ry9B

query
sites
4ry9B
I
 
F
K
 
K
I
 
I
G
 
G
L
 
V
V
 
S
V
 
M
K
|
K
S
 
T
L
 
L
G
 
S
N
 
A
G
 
P
F
x
Y
F
|
F
D
 
A
A
 
A
A
 
Q
N
 
M
K
 
E
G
 
A
A
 
A
Q
 
K
E
 
A
A
 
R
A
 
G
K
 
K
E
 
E
L
 
L
G
 
G
G
 
-
V
 
Y
E
 
E
V
 
V
I
 
L
Y
 
A
T
 
T
G
 
-
P
 
D
T
 
A
T
 
Q
T
 
G
T
 
K
A
 
L
E
 
Q
G
 
K
Q
 
Q
I
 
I
E
 
S
V
 
D
I
 
V
N
 
E
S
 
D
L
 
L
I
 
V
A
 
T
Q
 
R
G
 
G
V
 
V
S
 
K
A
 
L
I
 
L
A
 
I
V
 
I
S
 
N
A
 
P
N
 
A
D
|
D
P
x
S
D
 
E
A
 
G
L
 
L
V
 
V
P
 
N
A
 
A
L
 
V
K
 
N
K
 
N
A
 
A
A
 
S
Q
 
A
R
 
N
G
 
G
I
 
V
K
 
K
V
 
V
I
 
V
S
 
V
W
 
I
D
|
D
S
|
S
G
x
T
V
 
L
A
 
N
P
 
P
E
 
R
G
 
A
R
 
N
I
 
F
L
 
V
Q
 
T
L
 
Q
N
 
V
P
 
Q
S
 
S
S
 
S
N
 
N
E
 
S
L
 
I
I
 
N
G
 
G
K
 
A
M
 
L
C
 
V
L
 
G
T
 
H
L
 
W
V
 
V
K
 
I
D
 
E
H
 
E
L
 
V
D
 
G
G
 
N
G
 
K
K
 
S
G
 
L
D
 
K
F
 
I
A
 
A
I
 
L
L
 
L
S
 
S
A
 
G
T
 
E
T
 
K
-
 
G
-
x
N
-
x
P
-
 
V
-
 
G
T
 
Q
S
 
E
T
x
R
N
 
R
Q
 
L
N
 
G
I
 
V
W
 
L
I
 
S
D
 
G
Q
 
I
M
 
I
K
 
E
K
 
A
Q
 
Q
L
 
L
K
 
R
D
 
K
F
 
F
-
 
G
-
 
K
P
 
A
G
 
D
L
 
L
N
 
T
L
 
V
V
 
V
T
 
G
T
 
Q
V
 
G
Y
 
W
G
 
G
D
 
H
D
x
W
L
 
N
S
 
D
D
 
E
K
 
G
S
 
G
Y
 
L
R
 
K
E
 
A
A
 
M
E
 
E
G
 
D
L
 
L
L
 
L
K
 
V
A
 
A
N
 
N
P
 
K
N
 
D
I
 
I
K
 
N
V
 
M
I
 
V
V
 
L
A
 
G
P
 
E
T
x
N
T
 
D
V
 
S
G
 
M
V
 
V
L
 
L
A
 
G
A
 
A
S
 
R
K
 
R
V
 
A
V
 
I
E
 
E
D
 
S
K
 
A
G
 
G
L
 
R
V
 
T
G
 
G
K
 
I
V
 
L
Y
 
L
V
 
V
T
 
A
G
 
A
L
 
A
G
x
D
L
 
A
P
 
Q
S
 
K
E
 
E
M
 
A
A
 
L
G
 
A
A
 
L
I
 
I
K
 
K
S
 
Q
G
 
G
A
 
K
T
 
Y
K
 
G
E
 
V
F
 
T
A
 
G
I
 
L
W
 
N
N
 
D
P
 
P
I
 
A
D
 
L
L
 
V
G
 
A
Y
 
R
S
 
T
A
 
A
T
 
I
Q
 
D
I
 
L
A
 
G
Y
 
V
R
 
K
L
 
V
V
 
V
K
 
K
G
 
G
E
 
E
T
 
V
D
 
K
G
 
D
K
 
V
P
 
P

4ry9A Crystal structure of carbohydrate transporter solute binding protein veis_2079 from verminephrobacter eiseniae ef01-2, target efi-511009, a complex with d-talitol
25% identity, 80% coverage: 27:291/331 of query aligns to 3:272/297 of 4ry9A

query
sites
4ry9A
I
 
F
K
 
K
I
 
I
G
 
G
L
 
V
V
 
S
V
 
M
K
|
K
S
 
T
L
 
L
G
 
S
N
 
A
G
 
P
F
x
Y
F
|
F
D
 
A
A
 
A
A
 
Q
N
 
M
K
 
E
G
 
A
A
 
A
Q
 
K
E
 
A
A
 
R
A
 
G
K
 
K
E
 
E
L
 
L
G
 
G
G
 
-
V
 
Y
E
 
E
V
 
V
I
 
L
Y
 
A
T
 
T
G
 
-
P
 
D
T
 
A
T
 
Q
T
 
G
T
 
K
A
 
L
E
 
Q
G
 
K
Q
 
Q
I
 
I
E
 
S
V
 
D
I
 
V
N
 
E
S
 
D
L
 
L
I
 
V
A
 
T
Q
 
R
G
 
G
V
 
V
S
 
K
A
 
L
I
 
L
A
 
I
V
 
I
S
 
N
A
 
P
N
 
A
D
 
D
P
 
S
D
 
E
A
 
G
L
 
L
V
 
V
P
 
N
A
 
A
L
 
V
K
 
N
K
 
N
A
 
A
A
 
S
Q
 
A
R
 
N
G
 
G
I
 
V
K
 
K
V
 
V
I
 
V
S
 
V
W
 
I
D
|
D
S
|
S
G
 
T
V
 
L
A
 
N
P
 
P
E
 
R
G
 
A
R
 
N
I
 
F
L
 
V
Q
 
T
L
 
Q
N
 
V
P
 
Q
S
 
S
S
 
S
N
 
N
E
 
S
L
 
I
I
 
N
G
 
G
K
 
A
M
 
L
C
 
V
L
 
G
T
 
H
L
 
W
V
 
V
K
 
I
D
 
E
H
 
E
L
 
V
D
 
G
G
 
N
G
 
K
K
 
S
G
 
L
D
 
K
F
 
I
A
 
A
I
 
L
L
 
L
S
 
S
A
 
G
T
 
E
T
 
K
-
 
G
-
x
N
-
 
P
-
 
V
-
 
G
T
 
Q
S
 
E
T
x
R
N
 
R
Q
 
L
N
 
G
I
 
V
W
 
L
I
 
S
D
 
G
Q
 
I
M
 
I
K
 
E
K
 
A
Q
 
Q
L
 
L
K
 
R
D
 
K
F
 
F
-
 
G
-
 
K
P
 
A
G
 
D
L
 
L
N
 
T
L
 
V
V
 
V
T
 
G
T
 
Q
V
 
G
Y
 
W
G
 
G
D
 
H
D
x
W
L
 
N
S
 
D
D
 
E
K
 
G
S
 
G
Y
 
L
R
 
K
E
 
A
A
 
M
E
 
E
G
 
D
L
 
L
L
 
L
K
 
V
A
 
A
N
 
N
P
 
K
N
 
D
I
 
I
K
 
N
V
 
M
I
 
V
V
 
L
A
 
G
P
 
E
T
x
N
T
 
D
V
 
S
G
 
M
V
 
V
L
 
L
A
 
G
A
 
A
S
 
R
K
 
R
V
 
A
V
 
I
E
 
E
D
 
S
K
 
A
G
 
G
L
 
R
V
 
T
G
 
G
K
 
I
V
 
L
Y
 
L
V
 
V
T
 
A
G
 
A
L
 
A
G
x
D
L
 
A
P
 
Q
S
 
K
E
 
E
M
 
A
A
 
L
G
 
A
A
 
L
I
 
I
K
 
K
S
 
Q
G
 
G
A
 
K
T
 
Y
K
 
G
E
 
V
F
 
T
A
 
G
I
 
L
W
 
N
N
 
D
P
 
P
I
 
A
D
 
L
L
 
V
G
 
A
Y
 
R
S
 
T
A
 
A
T
 
I
Q
 
D
I
 
L
A
 
G
Y
 
V
R
 
K
L
 
V
V
 
V
K
 
K
G
 
G
E
 
E
T
 
V
D
 
K
G
 
D
K
 
V
P
 
P

2fn8A Thermotoga maritima ribose binding protein ribose bound form (see paper)
26% identity, 70% coverage: 28:258/331 of query aligns to 3:235/292 of 2fn8A

query
sites
2fn8A
K
 
K
I
 
M
G
 
A
L
 
I
V
 
V
V
 
I
K
 
S
S
 
T
L
 
L
G
 
N
N
|
N
G
 
P
F
x
W
F
|
F
D
 
V
A
 
V
A
 
L
N
 
A
K
 
E
G
 
T
A
 
A
Q
 
K
E
 
Q
A
 
R
A
 
A
K
 
E
E
 
Q
L
 
L
G
 
G
G
 
Y
V
 
E
E
 
A
V
 
T
I
 
I
Y
 
F
T
 
D
G
 
S
P
 
Q
T
 
N
T
 
D
T
 
T
T
 
A
A
 
K
E
 
E
G
 
S
Q
 
A
I
 
-
E
 
-
V
 
H
I
 
F
N
 
D
S
 
A
L
 
I
I
 
I
A
 
A
Q
 
A
G
 
G
V
 
Y
S
 
D
A
 
A
I
 
I
A
 
I
V
 
F
S
 
N
A
 
P
N
 
T
D
 
D
P
 
A
D
 
D
A
 
G
L
 
S
V
 
I
P
 
A
A
 
N
L
 
V
K
 
K
K
 
R
A
 
A
A
 
K
Q
 
E
R
 
A
G
 
G
I
 
I
K
 
P
V
 
V
I
 
F
S
 
C
W
 
V
D
|
D
S
x
R
G
 
G
V
 
I
A
 
N
P
 
A
E
 
R
G
 
G
-
 
L
-
 
A
-
 
V
-
 
A
R
 
Q
I
 
I
L
 
Y
Q
 
S
L
 
D
N
 
N
P
 
Y
S
 
Y
S
 
G
N
 
G
E
 
V
L
 
L
I
 
M
G
 
G
K
 
E
M
 
Y
C
 
F
L
 
V
T
 
K
L
 
F
V
 
L
K
 
K
D
 
E
-
 
K
H
 
Y
L
 
P
D
 
D
G
 
A
G
 
K
K
 
E
G
 
I
D
 
P
F
 
Y
A
 
A
-
 
E
-
 
L
-
 
L
-
 
G
I
 
I
L
 
L
S
 
S
A
 
A
T
 
Q
T
 
P
T
 
T
S
 
W
T
 
D
N
x
R
Q
 
S
N
 
N
I
 
-
W
 
-
I
 
-
D
 
-
Q
 
G
M
 
F
K
 
H
K
 
S
Q
 
V
L
 
V
K
 
D
D
 
Q
F
 
Y
P
 
P
G
 
E
L
 
F
N
 
K
L
 
M
V
 
V
T
 
A
T
 
Q
V
 
Q
Y
 
S
G
 
A
D
 
E
D
x
F
L
 
D
S
 
R
D
 
D
K
 
T
S
 
A
Y
 
Y
R
 
K
E
 
V
A
 
T
E
 
E
G
 
Q
L
 
I
L
 
L
K
 
Q
A
 
A
N
 
H
P
 
P
N
 
E
I
 
I
K
 
K
V
 
A
I
 
I
V
 
W
A
 
C
P
 
G
T
x
N
T
 
D
V
 
A
G
 
M
V
 
A
L
 
L
A
 
G
A
 
A
S
 
M
K
 
K
V
 
A
V
 
C
E
 
E
D
 
A
K
 
A
G
 
G
L
 
R
V
 
T
G
 
-
K
 
D
V
 
I
Y
 
Y
V
 
I
T
 
F
G
 
G
L
 
F
G
x
D
L
 
G
P
 
A
S
 
E
E
 
D
M
 
V
A
 
I
G
 
N
A
 
A
I
 
I
K
 
K
S
 
E
G
 
G

Sites not aligning to the query:

4rxtA Crystal structure of carbohydrate transporter solute binding protein arad_9553 from agrobacterium radiobacter, target efi-511541, in complex with d-arabinose
25% identity, 80% coverage: 23:286/331 of query aligns to 1:267/295 of 4rxtA

query
sites
4rxtA
S
 
S
A
 
M
A
 
A
D
 
E
I
 
V
K
 
T
I
 
I
G
 
P
L
 
I
V
 
I
V
 
V
K
|
K
S
 
D
L
 
T
G
 
T
N
 
S
G
 
F
F
x
Y
F
 
W
D
 
Q
A
 
I
A
 
V
N
 
L
K
 
A
G
 
G
A
 
A
Q
 
R
E
 
K
A
 
A
A
 
G
K
 
K
E
 
D
L
 
L
G
 
G
G
 
-
V
 
V
E
 
K
V
 
V
I
 
P
Y
 
E
T
 
L
G
 
G
P
 
A
T
 
Q
T
 
A
T
x
E
T
 
T
-
 
D
A
 
V
E
 
N
G
 
G
Q
 
Q
I
 
I
E
 
S
V
 
I
I
 
L
N
 
E
S
 
N
L
 
A
I
 
V
A
 
A
Q
 
G
G
 
K
V
 
P
S
 
A
A
 
A
I