SitesBLAST – Find functional sites

 

SitesBLAST

Comparing HSERO_RS22730 FitnessBrowser__HerbieS:HSERO_RS22730 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

5dvjA Crystal structure of galactose complexed periplasmic glucose binding protein (ppgbp) from p. Putida csv86 (see paper)
35% identity, 86% coverage: 52:433/446 of query aligns to 3:388/396 of 5dvjA

query
sites
5dvjA
G
 
G
S
 
T
L
 
V
Q
 
D
V
 
V
L
 
L
H
 
H
W
|
W
W
|
W
T
 
T
S
 
S
A
 
G
S
 
G
E
|
E
R
 
A
Q
 
K
A
 
A
I
 
V
N
 
E
V
 
T
V
 
L
V
 
K
N
 
Q
Q
 
Q
L
 
I
A
 
Q
K
 
K
Q
 
D
D
 
G
I
 
F
Q
 
I
W
 
W
R
 
K
D
 
D
V
 
N
A
 
A
I
 
V
P
 
A
G
 
G
G
|
G
A
x
G
G
 
G
M
 
A
G
 
A
A
 
A
A
 
M
K
 
T
V
 
V
L
 
L
K
 
K
S
 
T
M
 
R
V
 
A
L
 
I
A
 
S
N
 
G
R
 
N
A
 
P
P
 
P
E
 
S
V
 
A
T
 
A
Q
 
Q
L
 
I
N
x
K
G
 
G
V
 
P
V
 
D
F
 
I
G
 
Q
E
 
E
W
 
W
A
 
G
D
 
A
L
 
L
G
 
G
L
 
L
L
 
L
L
 
T
E
 
E
L
 
L
D
 
D
N
 
D
V
 
V
A
 
A
V
 
A
Q
 
A
G
 
N
N
 
K
W
 
W
E
 
D
K
 
D
Q
 
L
M
 
L
F
 
P
P
 
R
T
 
Q
V
 
V
W
 
A
S
 
D
L
 
I
L
 
M
N
 
K
N
 
Y
H
 
D
G
 
G
H
 
H
V
 
Y
V
 
V
A
 
A
A
 
V
P
 
P
L
 
V
G
 
N
I
 
I
H
 
H
R
 
R
I
 
V
N
 
N
S
 
W
L
 
L
Y
 
W
Y
 
I
N
 
N
V
 
P
A
 
Q
V
 
V
F
 
F
K
 
D
R
 
K
Y
 
A
N
 
G
L
 
A
S
 
K
P
 
V
P
 
P
K
 
T
T
 
T
W
 
L
D
 
D
E
 
E
F
 
L
D
 
F
Q
 
A
I
 
A
V
 
A
K
 
D
K
 
K
L
 
L
Q
 
K
G
 
A
S
 
A
G
 
G
V
 
F
V
 
I
P
 
P
L
 
L
A
 
A
Q
 
H
S
 
G
A
 
G
E
 
Q
A
 
P
W
 
W
Q
 
Q
L
 
D
A
 
S
T
 
T
L
 
V
F
 
F
E
 
E
N
 
D
L
 
L
A
 
V
L
 
L
A
 
S
E
 
I
S
 
L
G
 
G
P
 
P
A
 
K
Y
 
G
Y
 
Y
R
 
H
K
 
A
L
 
A
F
 
F
V
 
V
E
 
D
M
 
L
S
 
D
P
 
E
A
 
K
A
 
T
Y
 
L
L
 
T
D
 
G
A
 
P
R
 
Q
M
 
M
L
 
T
H
 
E
I
 
A
L
 
F
K
 
A
R
 
T
L
 
L
R
 
K
A
 
R
L
 
L
A
 
G
G
 
T
A
 
Y
M
 
M
A
 
D
Q
 
P
P
 
N
V
 
R
R
 
A
E
 
G
R
 
R
P
 
D
W
|
W
T
 
N
E
 
I
V
 
A
A
 
A
R
 
A
S
 
E
M
 
V
V
 
I
S
 
N
G
 
G
E
 
K
A
 
A
A
 
G
M
 
M
L
 
Q
I
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
K
G
 
S
E
 
E
L
 
W
N
 
S
A
 
A
W
 
A
G
 
G
M
 
K
E
 
V
V
 
A
D
 
G
Q
 
K
Q
 
D
F
 
Y
G
 
Q
C
 
C
A
 
V
P
 
A
A
 
F
P
 
P
G
 
G
T
 
T
G
 
Q
E
 
G
Y
 
S
H
 
F
L
 
A
Y
 
Y
S
 
N
T
 
I
D
|
D
T
 
S
L
 
L
A
 
A
M
 
M
F
 
F
A
 
K
G
 
L
N
 
K
Y
 
D
A
 
A
H
 
N
Q
 
D
-
 
I
P
 
K
M
 
A
Q
 
Q
E
 
N
T
 
D
L
 
L
A
 
A
R
 
K
L
 
V
T
 
A
M
 
L
S
 
E
P
 
P
A
 
E
V
 
F
Q
 
Q
S
 
T
E
 
V
Y
 
F
N
 
N
R
 
Q
I
 
N
K
|
K
G
 
G
S
 
S
I
 
L
P
 
P
V
 
V
L
 
R
R
 
Q
A
 
D
A
 
M
D
 
D
-
 
M
P
 
S
H
 
K
M
 
F
D
 
D
R
 
A
C
 
C
A
 
T
R
 
Q
D
 
K
S
 
S
W
 
A
R
 
A
T
 
D
F
 
F
-
 
K
-
 
E
-
 
A
S
 
A
K
 
K
G
 
G
P
 
D
M
 
G
W
 
L
Q
 
Q
A
 
-
P
 
P
S
 
S
L
 
M
V
 
A
H
|
H
R
 
N
M
 
M
A
 
A
T
 
T
D
 
T
D
 
L
T
 
A
T
 
V
K
 
Q
D
 
G
A
 
A
I
 
I
V
 
F
A
 
D
E
 
V
V
 
V
Q
 
T
R
 
N
F
 
F
F
 
L
M
 
N
D
 
D
R
 
P
S
 
Q
I
 
A
S
 
E
E
 
P
E
 
A
Q
 
T
A
 
A
Q
 
V
K
 
K
R
 
Q
L
 
L

5dviA High resolution crystal structure of glucose complexed periplasmic glucose binding protein (ppgbp) from p. Putida csv86 (see paper)
35% identity, 86% coverage: 52:433/446 of query aligns to 3:388/396 of 5dviA

query
sites
5dviA
G
 
G
S
 
T
L
 
V
Q
 
D
V
 
V
L
 
L
H
 
H
W
|
W
W
|
W
T
 
T
S
 
S
A
 
G
S
 
G
E
|
E
R
 
A
Q
 
K
A
 
A
I
 
V
N
 
E
V
 
T
V
 
L
V
 
K
N
 
Q
Q
 
Q
L
 
I
A
 
Q
K
 
K
Q
 
D
D
 
G
I
 
F
Q
 
I
W
 
W
R
 
K
D
 
D
V
 
N
A
 
A
I
 
V
P
 
A
G
 
G
G
 
G
A
x
G
G
 
G
M
 
A
G
 
A
A
 
A
A
 
M
K
 
T
V
 
V
L
 
L
K
 
K
S
 
T
M
 
R
V
 
A
L
 
I
A
 
S
N
 
G
R
 
N
A
 
P
P
 
P
E
 
S
V
 
A
T
 
A
Q
 
Q
L
 
I
N
x
K
G
 
G
V
 
P
V
 
D
F
 
I
G
 
Q
E
 
E
W
 
W
A
 
G
D
 
A
L
 
L
G
 
G
L
 
L
L
 
L
L
 
T
E
 
E
L
 
L
D
 
D
N
 
D
V
 
V
A
 
A
V
 
A
Q
 
A
G
 
N
N
 
K
W
 
W
E
 
D
K
 
D
Q
 
L
M
 
L
F
 
P
P
 
R
T
 
Q
V
 
V
W
 
A
S
 
D
L
 
I
L
 
M
N
 
K
N
 
Y
H
 
D
G
 
G
H
 
H
V
 
Y
V
 
V
A
 
A
A
 
V
P
 
P
L
 
V
G
 
N
I
 
I
H
 
H
R
 
R
I
 
V
N
 
N
S
 
W
L
 
L
Y
 
W
Y
 
I
N
 
N
V
 
P
A
 
Q
V
 
V
F
 
F
K
 
D
R
 
K
Y
 
A
N
 
G
L
 
A
S
 
K
P
 
V
P
 
P
K
 
T
T
 
T
W
 
L
D
 
D
E
 
E
F
 
L
D
 
F
Q
 
A
I
 
A
V
 
A
K
 
D
K
 
K
L
 
L
Q
 
K
G
 
A
S
 
A
G
 
G
V
 
F
V
 
I
P
 
P
L
 
L
A
 
A
Q
 
H
S
 
G
A
 
G
E
 
Q
A
 
P
W
 
W
Q
 
Q
L
 
D
A
 
S
T
 
T
L
 
V
F
 
F
E
 
E
N
 
D
L
 
L
A
 
V
L
 
L
A
 
S
E
 
I
S
 
L
G
 
G
P
 
P
A
 
K
Y
 
G
Y
 
Y
R
 
H
K
 
A
L
 
A
F
 
F
V
 
V
E
 
D
M
 
L
S
 
D
P
 
E
A
 
K
A
 
T
Y
 
L
L
 
T
D
 
G
A
 
P
R
 
Q
M
 
M
L
 
T
H
 
E
I
 
A
L
 
F
K
 
A
R
 
T
L
 
L
R
 
K
A
 
R
L
 
L
A
 
G
G
 
T
A
 
Y
M
 
M
A
 
D
Q
 
P
P
 
N
V
 
R
R
 
A
E
 
G
R
 
R
P
 
D
W
 
W
T
 
N
E
 
I
V
 
A
A
 
A
R
 
A
S
 
E
M
 
V
V
 
I
S
 
N
G
 
G
E
 
K
A
 
A
A
 
G
M
 
M
L
 
Q
I
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
K
G
 
S
E
 
E
L
 
W
N
 
S
A
 
A
W
 
A
G
 
G
M
 
K
E
 
V
V
 
A
D
 
G
Q
 
K
Q
 
D
F
 
Y
G
 
Q
C
 
C
A
 
V
P
 
A
A
 
F
P
 
P
G
 
G
T
 
T
G
 
Q
E
 
G
Y
 
S
H
 
F
L
 
A
Y
 
Y
S
x
N
T
 
I
D
|
D
T
 
S
L
 
L
A
 
A
M
 
M
F
 
F
A
 
K
G
 
L
N
 
K
Y
 
D
A
 
A
H
 
N
Q
 
D
-
 
I
P
 
K
M
 
A
Q
 
Q
E
 
N
T
 
D
L
 
L
A
 
A
R
 
K
L
 
V
T
 
A
M
 
L
S
 
E
P
 
P
A
 
E
V
 
F
Q
 
Q
S
 
T
E
 
V
Y
 
F
N
 
N
R
 
Q
I
 
N
K
|
K
G
 
G
S
 
S
I
 
L
P
 
P
V
 
V
L
 
R
R
 
Q
A
 
D
A
 
M
D
 
D
-
 
M
P
 
S
H
 
K
M
 
F
D
 
D
R
 
A
C
 
C
A
 
T
R
 
Q
D
 
K
S
 
S
W
 
A
R
 
A
T
 
D
F
 
F
-
 
K
-
 
E
-
 
A
S
 
A
K
 
K
G
 
G
P
 
D
M
 
G
W
 
L
Q
 
Q
A
 
-
P
 
P
S
 
S
L
 
M
V
 
A
H
|
H
R
 
N
M
 
M
A
 
A
T
 
T
D
 
T
D
 
L
T
 
A
T
 
V
K
 
Q
D
 
G
A
 
A
I
 
I
V
 
F
A
 
D
E
 
V
V
 
V
Q
 
T
R
 
N
F
 
F
F
 
L
M
 
N
D
 
D
R
 
P
S
 
Q
I
 
A
S
 
E
E
 
P
E
 
A
Q
 
T
A
 
A
Q
 
V
K
 
K
R
 
Q
L
 
L

4r2bA Crystal structure of sugar transporter oant_3817 from ochrobactrum anthropi, target efi-510528, with bound glucose
31% identity, 86% coverage: 53:435/446 of query aligns to 6:389/395 of 4r2bA

query
sites
4r2bA
S
 
N
L
 
V
Q
 
E
V
 
V
L
 
L
H
 
H
W
|
W
W
 
W
T
 
T
S
 
A
A
 
G
S
 
G
E
|
E
R
 
A
Q
 
A
A
 
A
I
 
L
N
 
D
V
 
V
V
 
L
V
 
K
N
 
K
Q
 
D
L
 
L
A
 
E
K
 
K
Q
 
K
D
 
G
I
 
I
Q
 
S
W
 
W
R
 
T
D
 
D
V
 
M
A
 
P
I
 
V
P
 
A
G
 
G
G
|
G
A
x
G
G
 
G
M
 
T
G
 
E
A
 
A
A
 
M
K
 
T
V
 
V
L
 
L
K
 
R
S
 
A
M
 
R
V
 
V
L
 
T
A
 
A
N
 
G
R
 
N
A
 
A
P
 
P
E
 
T
V
 
A
T
 
V
Q
 
Q
L
 
M
N
 
L
G
 
G
V
 
F
V
 
D
F
 
I
G
 
R
E
 
D
W
 
W
A
 
A
D
 
E
L
 
Q
G
 
G
L
 
A
L
 
L
L
 
G
E
 
N
L
 
L
D
 
D
N
 
E
V
 
I
A
 
A
V
 
N
Q
 
K
G
 
E
N
 
G
W
 
W
E
 
E
K
 
K
Q
 
V
M
 
I
F
 
P
P
 
A
T
 
P
V
 
L
W
 
Q
S
 
E
L
 
F
L
 
A
N
 
K
N
 
Y
H
 
D
G
 
G
H
 
H
V
 
W
V
 
I
A
 
A
A
 
A
P
 
P
L
 
V
G
 
N
I
 
V
H
|
H
R
 
S
I
 
T
N
 
N
S
 
W
L
 
M
Y
 
W
Y
 
I
N
 
N
V
 
K
A
 
A
V
 
A
F
 
L
K
 
D
R
 
K
Y
 
A
N
 
G
L
 
G
S
 
K
P
 
E
P
 
P
K
 
T
T
 
N
W
 
W
D
 
D
E
 
E
F
 
L
D
 
I
Q
 
A
I
 
L
V
 
L
K
 
D
K
 
K
L
 
F
Q
 
K
G
 
E
S
 
Q
G
 
G
V
 
I
V
 
T
P
 
P
L
 
I
A
 
A
Q
 
H
S
 
G
A
 
G
E
 
Q
A
 
P
W
 
W
Q
 
Q
L
 
D
A
 
A
T
 
T
L
 
I
F
 
F
E
 
D
N
 
A
L
 
V
A
 
V
L
 
L
A
 
S
E
 
-
S
 
F
G
 
G
P
 
T
A
 
D
Y
 
F
Y
 
Y
R
 
K
K
 
K
L
 
A
F
 
F
V
 
I
E
 
D
M
 
L
S
 
D
P
 
P
A
 
E
A
 
T
Y
 
L
L
 
G
D
 
S
A
 
D
R
 
T
M
 
M
L
 
K
H
 
Q
I
 
A
L
 
F
K
 
D
R
 
R
L
 
M
R
 
T
A
 
K
L
 
L
A
 
R
G
 
S
A
 
Y
M
 
V
A
 
D
Q
 
D
P
 
N
V
 
F
R
 
S
E
 
G
R
 
R
P
 
D
W
|
W
T
 
N
E
 
L
V
 
A
A
 
S
R
 
A
S
 
M
M
 
V
V
 
I
S
 
E
G
 
G
E
 
K
A
 
A
A
 
G
M
 
L
L
 
Q
I
 
F
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
K
G
 
G
E
 
E
L
 
F
N
 
V
A
 
K
W
 
A
G
 
G
M
 
K
E
 
K
V
 
P
D
 
G
Q
 
E
Q
 
D
F
 
F
G
 
V
C
 
C
A
 
M
P
 
R
A
 
Y
P
 
P
G
 
G
T
 
T
G
 
Q
E
 
G
Y
 
A
H
 
I
L
 
T
Y
 
F
S
 
N
T
 
S
D
|
D
T
 
M
L
 
F
A
 
A
M
 
M
F
 
F
A
 
K
G
 
V
N
 
S
Y
 
E
A
 
D
H
 
K
Q
 
V
P
 
P
M
 
A
Q
 
Q
E
 
L
T
 
E
L
 
M
A
 
A
R
 
S
L
 
A
T
 
I
M
 
E
S
 
S
P
 
P
A
 
T
V
 
F
Q
 
Q
S
 
S
E
 
A
Y
 
F
N
 
N
R
 
V
I
 
V
K
|
K
G
 
G
S
 
S
I
 
A
P
 
P
V
 
A
-
 
R
L
 
T
R
 
D
A
 
V
A
 
P
D
 
D
P
 
T
H
 
D
M
 
F
D
 
D
R
 
A
C
 
C
A
 
G
R
 
K
-
 
K
-
 
A
-
 
I
-
 
A
D
 
D
S
 
E
W
 
K
R
 
E
T
 
A
F
 
S
S
 
E
K
 
K
G
 
G
P
 
T
M
 
M
W
 
-
Q
 
-
A
 
L
P
 
G
S
 
S
L
 
M
V
 
A
H
|
H
R
 
G
M
 
Y
A
 
A
T
 
N
D
 
P
D
 
A
T
 
A
T
 
V
K
 
K
D
 
N
A
 
A
I
 
I
V
 
Y
A
 
D
E
 
V
V
 
V
Q
 
T
R
 
R
F
 
Q
F
 
F
M
 
-
D
 
N
R
 
G
S
 
Q
I
 
L
S
 
S
E
 
S
E
 
E
Q
 
D
A
 
A
Q
 
V
K
 
K
R
 
E
L
 
L
A
 
V
T
 
S

8hqqA Crystal structure of the glucose-binding protein sar11_0769 from "candidatus pelagibacter ubique" htcc1062 bound to glucose
34% identity, 82% coverage: 55:419/446 of query aligns to 6:377/398 of 8hqqA

query
sites
8hqqA
Q
 
E
V
 
V
L
 
L
H
 
H
W
|
W
W
 
W
T
 
T
S
 
G
A
 
G
S
 
G
E
|
E
R
 
A
Q
 
K
A
 
A
I
 
L
N
 
K
V
 
V
V
 
L
V
 
Q
N
 
D
Q
 
E
L
 
F
A
 
A
K
 
A
Q
 
Q
D
 
N
I
 
G
Q
 
V
W
 
W
R
 
L
D
 
D
V
 
M
A
 
P
I
 
V
P
 
S
G
 
G
G
 
G
A
x
G
G
 
G
M
 
D
G
 
A
A
 
A
A
 
M
K
 
Q
V
 
T
L
 
L
K
 
K
S
 
A
M
 
R
V
 
I
L
 
V
A
 
A
N
 
N
R
 
D
A
 
A
P
 
P
E
 
A
V
 
A
T
 
A
Q
 
Q
L
 
I
N
x
K
G
 
G
V
 
P
V
 
T
F
 
I
G
 
Q
E
 
E
W
 
Y
A
 
D
D
 
E
L
 
E
G
 
G
L
 
V
L
 
V
-
 
A
-
 
P
L
 
Y
E
 
N
L
 
I
D
 
D
N
 
A
V
 
V
A
 
A
V
 
K
Q
 
K
G
 
E
N
 
G
W
 
W
E
 
D
K
 
N
Q
 
L
M
 
L
F
 
S
P
 
K
T
 
Q
V
 
V
W
 
A
S
 
S
L
 
H
L
 
M
-
 
K
-
 
C
N
 
D
N
 
D
H
 
G
G
 
K
H
 
A
V
 
Y
V
 
C
A
 
A
A
 
A
P
 
P
L
 
V
G
 
N
I
 
I
H
|
H
R
 
R
I
 
I
N
 
D
S
 
W
L
 
I
Y
 
W
Y
 
A
N
 
N
V
 
K
A
 
K
V
 
V
F
 
L
K
 
D
R
 
S
Y
 
N
N
 
G
L
 
I
S
 
K
P
 
M
P
 
P
K
 
S
T
 
T
W
 
W
D
 
A
E
 
E
F
 
F
D
 
N
Q
 
A
I
 
A
V
 
A
K
 
D
K
 
K
L
 
L
Q
 
Q
G
 
A
S
 
N
G
 
G
V
 
I
V
 
I
P
 
P
L
 
L
A
 
A
Q
 
H
S
 
G
A
 
S
E
 
Q
A
 
P
W
 
W
Q
 
Q
L
 
D
A
 
A
T
 
T
L
 
V
F
 
F
E
 
E
N
 
A
L
 
V
A
 
A
L
 
L
A
 
G
E
 
V
S
 
G
G
 
G
P
 
N
A
 
D
Y
 
F
Y
 
Y
R
 
R
K
 
K
L
 
A
F
 
F
V
 
V
E
 
D
M
 
L
S
 
D
P
 
A
A
 
A
A
 
T
Y
 
L
L
 
G
D
 
G
A
 
S
R
 
T
M
 
M
L
 
T
H
 
K
I
 
V
L
 
F
K
 
D
R
 
Q
L
 
M
R
 
R
A
 
K
L
 
L
A
 
K
G
 
G
A
 
Y
M
 
T
A
 
D
Q
 
A
P
 
G
V
 
S
R
 
P
E
 
G
R
 
R
P
 
D
W
 
W
T
 
N
E
 
V
V
 
A
A
 
T
R
 
G
S
 
M
M
 
V
V
 
M
S
 
E
G
 
G
E
 
K
A
 
A
A
 
A
M
 
F
L
 
Q
I
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
K
G
 
G
E
 
E
L
 
F
N
 
A
A
 
A
W
 
N
G
 
N
M
 
M
E
 
A
V
 
P
D
 
G
Q
 
K
Q
 
D
F
 
Y
G
 
I
C
 
C
A
 
A
P
 
P
A
 
T
P
 
P
G
 
S
T
 
N
G
 
N
E
 
G
Y
 
Y
H
 
-
L
 
L
Y
 
Y
S
 
N
T
 
V
D
|
D
T
 
S
L
 
F
A
 
I
M
 
F
F
 
Y
A
 
K
G
 
V
N
 
K
Y
 
G
A
 
K
H
 
D
Q
 
K
-
 
V
P
 
E
M
 
G
Q
 
Q
E
 
K
T
 
L
L
 
L
A
 
A
R
 
S
L
 
L
T
 
M
M
 
M
S
 
G
P
 
K
A
 
N
V
 
F
Q
 
Q
S
 
K
E
 
V
Y
 
F
N
 
N
R
 
I
I
 
Y
K
|
K
G
 
G
S
 
S
I
 
I
P
 
P
V
 
A
-
 
R
L
 
L
R
 
D
A
 
V
A
 
S
D
 
M
P
 
D
H
 
E
M
 
F
D
 
D
R
 
M
C
 
C
A
 
A
R
 
K
D
 
K
S
 
S
W
 
N
R
 
A
T
 
D
F
 
L
-
 
K
-
 
T
-
 
A
-
 
G
S
 
S
K
 
K
G
 
G
P
 
G
M
 
L
W
 
-
Q
 
-
A
 
L
P
 
P
S
 
S
L
 
F
V
 
A
H
|
H
R
 
G
M
 
M
A
 
A
T
 
L
D
 
R
D
 
L
T
 
A
T
 
Q
K
 
K
D
 
G
A
 
A
I
 
I
V
 
Q
A
 
D
E
 
V
V
 
V
Q
 
T
R
 
E
F
 
H
F
 
F

2b3fA Thermus thermophilus glucose/galactose binding protein bound with galactose (see paper)
27% identity, 74% coverage: 54:385/446 of query aligns to 3:339/392 of 2b3fA

query
sites
2b3fA
L
 
L
Q
 
E
V
 
I
L
 
F
H
 
S
W
|
W
W
|
W
T
 
-
S
 
A
A
 
G
S
 
D
E
|
E
R
 
G
Q
 
P
A
 
A
I
 
L
N
 
E
V
 
A
V
 
L
V
 
I
N
 
-
Q
 
R
L
 
L
A
 
Y
K
 
K
Q
 
Q
D
 
K
-
 
Y
-
 
P
-
 
G
I
 
V
Q
 
E
W
 
V
R
 
I
D
 
N
V
 
A
A
 
T
I
 
V
P
 
T
G
 
G
G
|
G
A
|
A
G
 
G
M
 
V
G
 
N
A
 
A
A
 
R
K
 
A
V
 
V
L
 
L
K
 
K
S
 
T
M
 
R
V
 
M
L
 
L
A
 
G
N
 
G
R
 
D
A
 
P
P
 
P
E
 
D
V
 
T
T
 
F
Q
 
Q
L
 
V
N
x
H
G
 
A
-
 
G
-
 
M
V
 
E
V
 
L
F
 
I
G
 
G
E
 
T
W
 
W
A
 
V
D
 
V
L
 
A
G
 
N
L
 
R
L
 
M
L
 
E
E
 
D
L
 
L
D
 
S
N
 
A
V
 
L
A
 
F
V
 
R
Q
 
Q
G
 
E
N
 
G
W
 
W
E
 
L
K
 
Q
Q
 
A
M
 
F
F
 
P
P
 
K
T
 
G
V
 
L
W
 
I
S
 
D
L
 
L
L
 
I
N
 
S
N
 
Y
H
 
K
G
 
G
H
 
G
V
 
I
V
 
W
A
 
S
A
 
V
P
 
P
L
 
V
G
 
N
I
 
I
H
 
H
R
 
R
I
 
S
N
 
N
S
 
V
L
 
M
Y
 
W
Y
 
Y
N
 
L
V
 
P
A
 
A
V
 
K
F
 
L
K
 
K
R
 
G
Y
 
W
N
 
G
L
 
V
S
 
N
P
 
P
P
 
P
K
 
R
T
 
T
W
 
W
D
 
D
E
 
K
F
 
F
D
 
L
Q
 
A
I
 
T
V
 
C
K
 
Q
K
 
T
L
 
L
Q
 
K
G
 
Q
S
 
K
G
 
G
V
 
L
-
 
E
V
 
A
P
 
P
L
 
L
A
 
A
Q
 
L
S
 
-
A
 
G
E
 
E
A
 
N
W
 
W
Q
 
T
L
 
Q
A
 
Q
T
 
H
L
 
L
F
 
W
E
 
E
N
 
S
L
 
V
A
 
A
L
 
L
A
 
A
E
 
V
S
 
L
G
 
G
P
 
P
A
 
D
Y
 
D
Y
 
W
R
 
N
K
 
N
L
 
L
F
 
W
V
 
-
E
 
-
M
 
N
S
 
G
P
 
K
A
 
L
A
 
K
Y
 
F
L
 
T
D
 
D
A
 
P
R
 
K
M
 
A
L
 
V
H
 
R
I
 
A
L
 
W
K
 
E
R
 
V
L
 
F
R
 
G
A
 
R
L
 
V
A
 
L
G
 
D
A
 
C
M
 
A
A
 
N
Q
 
K
P
 
D
V
 
A
R
 
A
E
 
G
R
 
L
P
 
S
W
 
W
T
 
Q
E
 
Q
V
 
A
A
 
V
R
 
D
S
 
R
M
 
V
V
 
V
S
 
Q
G
 
G
E
 
K
A
 
A
A
 
A
M
 
F
L
 
N
I
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
A
G
 
G
E
 
Y
L
 
M
-
 
T
N
 
T
A
 
T
W
 
L
G
 
K
M
 
L
E
 
K
V
 
P
D
 
G
Q
 
T
Q
 
D
F
 
F
G
 
A
C
 
W
A
 
A
P
 
P
A
 
S
P
 
P
G
 
G
T
 
T
G
 
Q
E
 
G
Y
 
V
H
 
F
L
 
M
Y
 
M
S
 
L
T
 
S
D
|
D
T
 
S
L
 
F
A
 
G
M
 
L
F
 
P
A
 
K
G
 
G
N
 
A
Y
 
K
A
 
N
H
 
R
Q
 
Q
P
 
N
M
 
A
Q
 
I
E
 
N
T
 
W
L
 
L
A
 
-
R
 
R
L
 
L
T
 
V
M
 
G
S
 
S
P
 
K
A
 
E
V
 
G
Q
 
Q
S
 
D
E
 
T
Y
 
S
N
 
N
R
 
P
I
 
L
K
|
K
G
 
G
S
 
S
I
 
I
P
 
A
V
 
A
L
 
R
R
 
L
A
 
D
A
 
S
D
 
D
P
 
P
H
 
S
-
 
K
-
 
Y
-
 
N
-
 
A
M
 
Y
D
 
G
R
 
Q
C
 
S
A
 
A
R
 
M
D
 
R
S
 
D
W
 
W
R
 
R
T
 
S

Sites not aligning to the query:

2b3bC Thermus thermophilus glucose/galactose binding protein with bound glucose (see paper)
27% identity, 74% coverage: 54:385/446 of query aligns to 3:339/392 of 2b3bC

query
sites
2b3bC
L
 
L
Q
 
E
V
 
I
L
 
F
H
 
S
W
|
W
W
 
W
T
 
-
S
 
A
A
 
G
S
 
D
E
|
E
R
 
G
Q
 
P
A
 
A
I
 
L
N
 
E
V
 
A
V
 
L
V
 
I
N
 
-
Q
 
R
L
 
L
A
 
Y
K
 
K
Q
 
Q
D
 
K
-
 
Y
-
 
P
-
 
G
I
 
V
Q
 
E
W
 
V
R
 
I
D
 
N
V
 
A
A
 
T
I
 
V
P
 
T
G
 
G
G
 
G
A
|
A
G
 
G
M
 
V
G
 
N
A
 
A
A
 
R
K
 
A
V
 
V
L
 
L
K
 
K
S
 
T
M
 
R
V
 
M
L
 
L
A
 
G
N
 
G
R
 
D
A
 
P
P
 
P
E
 
D
V
 
T
T
 
F
Q
 
Q
L
 
V
N
x
H
G
 
A
-
 
G
-
 
M
V
 
E
V
 
L
F
 
I
G
 
G
E
 
T
W
 
W
A
 
V
D
 
V
L
 
A
G
 
N
L
 
R
L
 
M
L
 
E
E
 
D
L
 
L
D
 
S
N
 
A
V
 
L
A
 
F
V
 
R
Q
 
Q
G
 
E
N
 
G
W
 
W
E
 
L
K
 
Q
Q
 
A
M
 
F
F
 
P
P
 
K
T
 
G
V
 
L
W
 
I
S
 
D
L
 
L
L
 
I
N
 
S
N
 
Y
H
 
K
G
 
G
H
 
G
V
 
I
V
 
W
A
 
S
A
 
V
P
 
P
L
 
V
G
 
N
I
 
I
H
 
H
R
 
R
I
 
S
N
 
N
S
 
V
L
 
M
Y
 
W
Y
 
Y
N
 
L
V
 
P
A
 
A
V
 
K
F
 
L
K
 
K
R
 
G
Y
 
W
N
 
G
L
 
V
S
 
N
P
 
P
P
 
P
K
 
R
T
 
T
W
 
W
D
 
D
E
 
K
F
 
F
D
 
L
Q
 
A
I
 
T
V
 
C
K
 
Q
K
 
T
L
 
L
Q
 
K
G
 
Q
S
 
K
G
 
G
V
 
L
-
 
E
V
 
A
P
 
P
L
 
L
A
 
A
Q
 
L
S
 
-
A
 
G
E
 
E
A
 
N
W
 
W
Q
 
T
L
 
Q
A
 
Q
T
 
H
L
 
L
F
 
W
E
 
E
N
 
S
L
 
V
A
 
A
L
 
L
A
 
A
E
 
V
S
 
L
G
 
G
P
 
P
A
 
D
Y
 
D
Y
 
W
R
 
N
K
 
N
L
 
L
F
 
W
V
 
-
E
 
-
M
 
N
S
 
G
P
 
K
A
 
L
A
 
K
Y
 
F
L
 
T
D
 
D
A
 
P
R
 
K
M
 
A
L
 
V
H
 
R
I
 
A
L
 
W
K
 
E
R
 
V
L
 
F
R
 
G
A
 
R
L
 
V
A
 
L
G
 
D
A
 
C
M
 
A
A
 
N
Q
 
K
P
 
D
V
 
A
R
 
A
E
 
G
R
 
L
P
 
S
W
 
W
T
 
Q
E
 
Q
V
 
A
A
 
V
R
 
D
S
 
R
M
 
V
V
 
V
S
 
Q
G
 
G
E
 
K
A
 
A
A
 
A
M
 
F
L
 
N
I
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
A
G
 
G
E
 
Y
L
 
M
-
 
T
N
 
T
A
 
T
W
 
L
G
 
K
M
 
L
E
 
K
V
 
P
D
 
G
Q
 
T
Q
 
D
F
 
F
G
 
A
C
 
W
A
 
A
P
 
P
A
 
S
P
 
P
G
 
G
T
 
T
G
 
Q
E
 
G
Y
 
V
H
 
F
L
 
M
Y
 
M
S
 
L
T
 
S
D
|
D
T
 
S
L
 
F
A
 
G
M
 
L
F
 
P
A
 
K
G
 
G
N
 
A
Y
 
K
A
 
N
H
 
R
Q
 
Q
P
 
N
M
 
A
Q
 
I
E
 
N
T
 
W
L
 
L
A
 
-
R
 
R
L
 
L
T
 
V
M
 
G
S
 
S
P
 
K
A
 
E
V
 
G
Q
 
Q
S
 
D
E
 
T
Y
 
S
N
 
N
R
 
P
I
 
L
K
|
K
G
 
G
S
 
S
I
 
I
P
 
A
V
 
A
L
 
R
R
 
L
A
 
D
A
 
S
D
 
D
P
 
P
H
 
S
-
 
K
-
 
Y
-
 
N
-
 
A
M
 
Y
D
 
G
R
 
Q
C
 
S
A
 
A
R
 
M
D
 
R
S
 
D
W
 
W
R
 
R
T
 
S

Sites not aligning to the query:

2b3bA Thermus thermophilus glucose/galactose binding protein with bound glucose (see paper)
27% identity, 74% coverage: 54:385/446 of query aligns to 3:339/392 of 2b3bA

query
sites
2b3bA
L
 
L
Q
 
E
V
 
I
L
 
F
H
 
S
W
|
W
W
|
W
T
 
-
S
 
A
A
 
G
S
 
D
E
|
E
R
 
G
Q
 
P
A
 
A
I
 
L
N
 
E
V
 
A
V
 
L
V
 
I
N
 
-
Q
 
R
L
 
L
A
 
Y
K
 
K
Q
 
Q
D
 
K
-
 
Y
-
 
P
-
 
G
I
 
V
Q
 
E
W
 
V
R
 
I
D
 
N
V
 
A
A
 
T
I
 
V
P
 
T
G
 
G
G
 
G
A
|
A
G
 
G
M
 
V
G
 
N
A
 
A
A
 
R
K
 
A
V
 
V
L
 
L
K
 
K
S
 
T
M
 
R
V
 
M
L
 
L
A
 
G
N
 
G
R
 
D
A
 
P
P
 
P
E
 
D
V
 
T
T
 
F
Q
 
Q
L
 
V
N
x
H
G
 
A
-
 
G
-
 
M
V
 
E
V
 
L
F
 
I
G
 
G
E
 
T
W
 
W
A
 
V
D
 
V
L
 
A
G
 
N
L
 
R
L
 
M
L
 
E
E
 
D
L
 
L
D
 
S
N
 
A
V
 
L
A
 
F
V
 
R
Q
 
Q
G
 
E
N
 
G
W
 
W
E
 
L
K
 
Q
Q
 
A
M
 
F
F
 
P
P
 
K
T
 
G
V
 
L
W
 
I
S
 
D
L
 
L
L
 
I
N
 
S
N
 
Y
H
 
K
G
 
G
H
 
G
V
 
I
V
 
W
A
 
S
A
 
V
P
 
P
L
 
V
G
 
N
I
 
I
H
 
H
R
 
R
I
 
S
N
 
N
S
 
V
L
 
M
Y
 
W
Y
 
Y
N
 
L
V
 
P
A
 
A
V
 
K
F
 
L
K
 
K
R
 
G
Y
 
W
N
 
G
L
 
V
S
 
N
P
 
P
P
 
P
K
 
R
T
 
T
W
 
W
D
 
D
E
 
K
F
 
F
D
 
L
Q
 
A
I
 
T
V
 
C
K
 
Q
K
 
T
L
 
L
Q
 
K
G
 
Q
S
 
K
G
 
G
V
 
L
-
 
E
V
 
A
P
 
P
L
 
L
A
 
A
Q
 
L
S
 
-
A
 
G
E
 
E
A
 
N
W
 
W
Q
 
T
L
 
Q
A
 
Q
T
 
H
L
 
L
F
 
W
E
 
E
N
 
S
L
 
V
A
 
A
L
 
L
A
 
A
E
 
V
S
 
L
G
 
G
P
 
P
A
 
D
Y
 
D
Y
 
W
R
 
N
K
 
N
L
 
L
F
 
W
V
 
-
E
 
-
M
 
N
S
 
G
P
 
K
A
 
L
A
 
K
Y
 
F
L
 
T
D
 
D
A
 
P
R
 
K
M
 
A
L
 
V
H
 
R
I
 
A
L
 
W
K
 
E
R
 
V
L
 
F
R
 
G
A
 
R
L
 
V
A
 
L
G
 
D
A
 
C
M
 
A
A
 
N
Q
 
K
P
 
D
V
 
A
R
 
A
E
 
G
R
 
L
P
 
S
W
 
W
T
 
Q
E
 
Q
V
 
A
A
 
V
R
 
D
S
 
R
M
 
V
V
 
V
S
 
Q
G
 
G
E
 
K
A
 
A
A
 
A
M
 
F
L
 
N
I
 
I
M
 
M
G
 
G
D
 
D
W
|
W
A
 
A
K
 
A
G
 
G
E
 
Y
L
 
M
-
 
T
N
 
T
A
 
T
W
 
L
G
 
K
M
 
L
E
 
K
V
 
P
D
 
G
Q
 
T
Q
 
D
F
 
F
G
 
A
C
 
W
A
 
A
P
 
P
A
 
S
P
 
P
G
 
G
T
 
T
G
 
Q
E
 
G
Y
 
V
H
 
F
L
 
M
Y
 
M
S
 
L
T
 
S
D
|
D
T
 
S
L
 
F
A
 
G
M
 
L
F
 
P
A
 
K
G
 
G
N
 
A
Y
 
K
A
 
N
H
 
R
Q
 
Q
P
 
N
M
 
A
Q
 
I
E
 
N
T
 
W
L
 
L
A
 
-
R
 
R
L
 
L
T
 
V
M
 
G
S
 
S
P
 
K
A
 
E
V
 
G
Q
 
Q
S
 
D
E
 
T
Y
 
S
N
 
N
R
 
P
I
 
L
K
|
K
G
 
G
S
 
S
I
 
I
P
 
A
V
 
A
L
 
R
R
 
L
A
 
D
A
 
S
D
 
D
P
 
P
H
 
S
-
 
K
-
 
Y
-
 
N
-
 
A
M
 
Y
D
 
G
R
 
Q
C
 
S
A
 
A
R
 
M
D
 
R
S
 
D
W
 
W
R
 
R
T
 
S

Sites not aligning to the query:

7ehqA Chitin oligosaccharide binding protein (see paper)
25% identity, 55% coverage: 49:295/446 of query aligns to 16:252/406 of 7ehqA

query
sites
7ehqA
T
 
T
A
 
A
T
 
K
G
 
N
S
 
T
L
 
L
Q
 
A
V
 
L
L
 
L
H
 
E
W
 
K
W
 
V
T
 
V
S
 
K
A
 
K
S
 
T
E
 
E
R
 
A
Q
 
E
A
 
V
I
 
P
N
 
G
V
 
A
V
 
T
V
 
F
N
 
K
Q
 
L
L
 
D
A
 
G
K
 
V
Q
 
E
D
|
D
I
 
T
Q
 
V
W
 
N
R
 
R
D
 
D
V
 
V
A
 
K
I
 
-
P
 
-
G
 
-
G
 
-
A
 
-
G
 
-
M
 
-
G
 
-
A
 
-
A
 
-
K
 
-
V
 
-
L
 
L
K
 
K
S
 
A
M
 
E
V
 
M
L
 
A
A
 
A
N
 
G
R
 
K
A
 
P
P
 
P
E
 
Q
V
 
I
T
 
F
Q
 
N
L
 
L
-
x
F
N
 
G
G
 
G
V
 
A
V
 
D
F
 
T
G
 
Q
E
 
N
W
 
Y
A
 
A
D
 
K
L
 
A
G
 
G
L
 
H
L
 
L
L
 
L
E
 
P
L
 
L
D
 
N
N
 
D
V
 
I
A
 
L
V
 
K
Q
 
E
G
 
L
N
 
G
W
 
L
E
 
E
K
 
D
Q
 
K
M
 
F
F
 
F
P
 
E
T
 
L
V
 
R
W
 
E
S
 
F
L
 
T
L
 
V
N
 
D
N
 
-
H
 
-
G
 
G
H
 
K
V
 
I
V
 
Y
A
 
G
A
 
L
P
 
P
L
 
E
G
 
A
I
 
-
H
 
G
R
x
F
I
 
V
N
 
E
S
 
G
L
 
F
Y
 
Y
Y
 
Y
N
 
N
V
 
T
A
 
K
V
 
L
F
 
F
K
 
A
R
 
D
Y
 
A
N
 
G
L
 
I
-
 
T
S
 
S
P
 
A
P
 
P
K
 
K
T
 
T
W
 
W
D
 
D
E
 
E
F
 
F
D
 
T
Q
 
K
I
 
A
V
 
L
K
 
E
K
 
A
L
 
L
Q
 
K
G
 
A
S
 
K
G
 
N
V
 
I
V
 
T
P
 
P
L
 
I
A
 
A
-
 
L
-
 
G
-
 
G
Q
 
G
S
 
S
A
 
G
E
 
D
A
 
G
W
|
W
Q
 
A
L
 
I
A
 
N
T
 
M
L
 
L
F
 
A
E
 
N
N
 
S
L
 
L
A
 
F
L
 
V
A
 
A
E
 
T
S
 
A
G
 
G
P
 
P
A
 
E
Y
 
A
Y
 
Q
R
 
E
K
 
G
L
 
F
F
 
-
V
 
-
E
 
A
M
 
K
S
 
G
P
 
T
A
 
T
A
 
K
Y
 
W
L
 
T
D
 
D
A
 
P
R
 
A
M
 
V
L
 
L
H
 
D
I
 
G
L
 
F
K
 
K
R
 
R
L
 
L
R
 
K
A
 
D
L
 
L
-
 
K
-
 
D
A
 
K
G
 
G
A
 
Y
M
 
I
A
 
D
Q
 
P
P
 
N
V
 
V
R
 
L
E
 
G
R
 
L
P
 
K
W
 
Y
T
 
S
E
 
E
V
 
G
A
 
Q
R
 
A
S
 
K
M
 
F
V
 
Y
S
 
T
G
 
G
E
 
Q
A
 
A
A
 
A
M
 
M
L
 
L
I
 
F
M
 
D
G
 
G
D
 
S
W
|
W
A
 
A

Sites not aligning to the query:

3oo6A Crystal structures and biochemical characterization of the bacterial solute receptor acbh reveal an unprecedented exclusive substrate preference for b-d-galactopyranose (see paper)
27% identity, 30% coverage: 157:292/446 of query aligns to 105:238/390 of 3oo6A

query
sites
3oo6A
G
 
G
H
 
H
V
 
Y
V
 
Y
A
 
L
A
 
V
P
 
P
L
 
L
G
 
-
I
 
Y
H
 
N
R
x
Y
I
 
P
N
x
W
S
 
V
L
 
V
Y
 
F
Y
 
Y
N
 
N
V
 
K
A
 
S
V
 
V
F
 
F
K
 
Q
R
 
S
Y
 
K
N
 
G
L
 
Y
S
 
E
P
 
V
P
 
P
K
 
A
T
 
S
W
 
W
D
 
E
E
 
A
F
 
F
D
 
I
Q
 
A
I
 
L
V
 
A
K
 
R
K
 
K
L
 
M
Q
 
Q
G
 
S
S
 
D
G
 
G
V
 
L
V
 
V
P
 
P
L
 
L
A
 
A
-
 
F
Q
 
A
S
 
D
A
 
K
E
 
D
A
 
G
W
|
W
Q
 
P
L
 
A
A
 
L
T
 
G
L
 
T
F
 
F
E
 
D
N
 
I
L
 
L
A
 
N
L
 
L
A
 
R
E
 
I
S
 
N
G
 
G
P
 
Y
A
 
D
Y
 
Y
Y
 
H
R
 
I
K
 
K
L
 
L
F
 
M
V
 
K
E
 
H
M
 
E
S
 
V
P
 
P
A
 
-
A
 
-
Y
 
W
L
 
T
D
 
D
A
 
P
R
 
G
M
 
V
L
 
T
H
 
K
I
 
V
L
 
F
K
 
D
R
 
Q
L
 
W
R
 
R
A
 
E
L
 
L
A
 
A
G
 
A
A
 
Y
M
 
Q
A
 
Q
Q
 
K
P
 
G
V
 
A
R
 
N
E
 
G
R
 
R
P
 
T
W
 
W
T
 
Q
E
 
D
V
 
A
A
 
A
R
 
K
S
 
A
M
 
L
V
 
E
S
 
N
G
 
K
E
 
Q
A
 
A
A
 
G
M
 
M
L
 
M
I
 
F
M
 
Q
G
 
G

Sites not aligning to the query:

6preA Sbp rafe in complex with verbascose (see paper)
26% identity, 46% coverage: 96:300/446 of query aligns to 43:250/386 of 6preA

query
sites
6preA
A
 
A
A
x
G
K
 
E
V
 
V
L
 
L
K
 
K
S
 
T
M
 
R
V
 
V
L
 
L
A
 
A
N
 
G
R
 
D
A
 
V
P
 
P
E
 
D
V
 
V
T
 
V
Q
 
N
L
 
I
-
x
Y
-
 
P
N
x
Q
G
 
S
V
 
I
V
 
E
F
 
L
G
 
Q
E
 
E
W
 
W
A
 
A
D
 
K
L
 
A
G
 
G
L
 
V
L
 
F
L
 
E
E
 
D
L
 
L
D
 
S
N
 
N
V
 
-
A
 
-
V
 
-
Q
 
-
G
 
K
N
 
D
W
 
Y
E
 
L
K
 
K
Q
 
R
M
 
V
F
 
K
P
 
N
T
 
G
V
 
Y
W
 
A
S
 
E
L
 
K
L
 
Y
N
 
A
N
 
V
H
 
N
G
 
E
H
 
K
V
 
V
V
 
Y
A
 
N
A
 
V
P
 
P
L
 
F
G
 
T
I
 
A
H
 
N
R
 
A
I
 
Y
N
 
-
S
 
G
L
 
I
Y
 
Y
Y
 
Y
N
 
N
V
 
K
A
 
D
V
 
K
F
 
F
K
 
E
R
 
E
Y
 
L
N
 
G
L
 
L
S
 
K
P
 
V
P
 
P
K
 
E
T
 
T
W
 
W
D
 
D
E
 
E
F
 
F
D
 
E
Q
 
Q
I
 
L
V
 
V
K
 
K
K
 
D
L
 
I
Q
 
V
G
 
A
S
 
K
G
 
G
V
 
Q
V
 
T
P
 
P
L
 
F
A
 
G
-
 
I
Q
 
A
S
 
G
A
 
A
E
 
D
A
 
A
W
|
W
Q
 
T
L
 
L
A
x
N
T
 
G
L
 
-
F
 
Y
E
 
N
N
 
Q
L
 
L
A
 
A
L
 
F
A
 
A
E
 
T
S
 
A
G
 
T
P
 
G
A
 
G
-
 
G
-
 
K
-
 
E
-
 
A
-
 
N
-
 
Q
-
 
Y
-
 
L
-
 
R
Y
 
Y
Y
 
S
R
 
Q
K
 
P
L
 
N
F
 
A
V
 
I
E
 
K
M
 
L
S
 
S
-
 
D
P
 
P
A
 
I
A
 
M
Y
 
K
L
 
D
D
 
D
A
 
I
R
 
K
M
 
V
L
 
M
H
 
D
I
 
I
L
 
L
K
 
R
R
 
-
L
 
-
R
 
-
A
 
-
L
 
I
A
 
N
G
 
G
A
 
S
M
 
K
A
 
Q
Q
 
K
P
 
N
V
 
W
R
 
E
E
 
G
R
 
A
P
 
G
W
 
Y
T
 
T
E
 
D
V
 
V
A
 
I
R
 
G
S
 
A
M
 
F
V
 
A
S
 
R
G
 
G
E
 
D
A
 
V
A
 
L
M
 
M
L
 
T
I
 
P
M
 
N
G
 
G
D
 
S
W
|
W
A
 
A
K
 
I
G
 
T
E
 
A
L
 
I
N
 
N

Sites not aligning to the query:

2i58A Crystal structure of rafe from streptococcus pneumoniae complexed with raffinose
26% identity, 46% coverage: 96:300/446 of query aligns to 42:249/385 of 2i58A

query
sites
2i58A
A
 
A
A
 
G
K
 
E
V
 
V
L
 
L
K
 
K
S
 
T
M
 
R
V
 
V
L
 
L
A
 
A
N
 
G
R
 
D
A
 
V
P
 
P
E
 
D
V
 
V
T
 
V
Q
 
N
L
 
I
-
x
Y
-
 
P
N
x
Q
G
 
S
V
 
I
V
 
E
F
 
L
G
 
Q
E
 
E
W
 
W
A
 
A
D
 
K
L
 
A
G
 
G
L
 
V
L
 
F
L
 
E
E
 
D
L
 
L
D
 
S
N
 
N
V
 
-
A
 
-
V
 
-
Q
 
-
G
 
K
N
 
D
W
 
Y
E
 
L
K
 
K
Q
 
R
M
 
V
F
 
K
P
 
N
T
 
G
V
 
Y
W
 
A
S
 
E
L
 
K
L
 
Y
N
 
A
N
 
V
H
 
N
G
 
E
H
 
K
V
 
V
V
 
Y
A
 
N
A
 
V
P
 
P
L
 
F
G
 
T
I
 
A
H
 
N
R
 
A
I
 
Y
N
 
-
S
 
G
L
 
I
Y
 
Y
Y
 
Y
N
 
N
V
 
K
A
 
D
V
 
K
F
 
F
K
 
E
R
 
E
Y
 
L
N
 
G
L
 
L
S
 
K
P
 
V
P
 
P
K
 
E
T
 
T
W
 
W
D
 
D
E
 
E
F
 
F
D
 
E
Q
 
Q
I
 
L
V
 
V
K
 
K
K
 
D
L
 
I
Q
 
V
G
 
A
S
 
K
G
 
G
V
 
Q
V
 
T
P
 
P
L
 
F
A
 
G
-
 
I
Q
 
A
S
 
G
A
 
A
E
 
D
A
 
A
W
|
W
Q
 
T
L
 
L
A
x
N
T
 
G
L
 
-
F
 
Y
E
 
N
N
 
Q
L
 
L
A
 
A
L
 
F
A
 
A
E
 
T
S
 
A
G
 
T
P
 
G
A
 
G
-
 
G
-
 
K
-
 
E
-
 
A
-
 
N
-
 
Q
-
 
Y
-
 
L
-
 
R
Y
 
Y
Y
 
S
R
 
Q
K
 
P
L
 
N
F
 
A
V
 
I
E
 
K
M
 
L
S
 
S
-
 
D
P
 
P
A
 
I
A
 
M
Y
 
K
L
 
D
D
 
D
A
 
I
R
 
K
M
 
V
L
 
M
H
 
D
I
 
I
L
 
L
K
 
R
R
 
-
L
 
-
R
 
-
A
 
-
L
 
I
A
 
N
G
 
G
A
 
S
M
 
K
A
 
Q
Q
 
K
P
 
N
V
 
W
R
 
E
E
 
G
R
 
A
P
 
G
W
 
Y
T
 
T
E
 
D
V
 
V
A
 
I
R
 
G
S
 
A
M
 
F
V
 
A
S
 
R
G
 
G
E
 
D
A
 
V
A
 
L
M
 
M
L
 
T
I
 
P
M
 
N
G
 
G
D
 
S
W
|
W
A
 
A
K
 
I
G
 
T
E
 
A
L
 
I
N
 
N

Sites not aligning to the query:

3vxcA Crystal structure of xylobiose-bxle complex from streptomyces thermoviolaceus opc-520
26% identity, 39% coverage: 121:294/446 of query aligns to 77:249/398 of 3vxcA

query
sites
3vxcA
G
 
G
E
 
Q
W
 
L
A
 
V
D
 
D
L
 
L
G
 
T
L
 
D
L
 
V
L
 
I
E
 
K
L
 
S
D
 
D
N
 
E
V
 
V
A
 
L
V
 
S
Q
 
T
G
 
G
N
 
-
W
 
-
E
 
-
K
 
-
Q
 
-
M
 
F
F
 
L
P
 
P
T
 
S
V
 
V
W
 
V
S
 
A
L
 
A
L
 
G
N
 
S
N
 
L
H
 
D
G
 
G
H
 
H
V
 
E
V
 
Y
A
 
G
A
 
I
P
 
P
L
 
M
G
x
R
I
 
G
H
 
M
R
x
Q
I
 
P
N
 
V
S
 
L
L
 
L
Y
 
F
Y
 
Y
N
 
N
V
 
K
A
 
S
V
 
V
F
 
F
K
 
A
R
 
E
Y
 
H
N
 
K
L
 
L
S
 
T
P
 
P
P
 
P
K
 
T
T
 
T
W
 
W
D
 
D
E
 
Q
F
 
L
D
 
L
Q
 
D
I
 
N
V
 
V
K
 
A
K
 
K
L
 
L
Q
 
K
G
 
K
S
 
A
G
 
G
V
 
V
V
 
T
P
 
P
L
 
F
A
 
A
-
 
L
Q
 
G
S
 
G
A
 
V
E
 
E
A
 
I
W
|
W
Q
 
P
L
 
E
A
 
L
T
 
M
L
 
W
F
 
L
E
 
E
N
 
Y
L
 
L
A
 
V
L
 
D
A
 
R
E
 
I
S
 
G
G
 
G
P
 
P
A
 
Q
Y
 
V
Y
 
F
R
 
D
K
 
K
L
 
I
F
 
-
V
 
R
E
 
N
M
 
G
S
 
D
P
 
A
A
 
S
A
 
G
Y
 
W
L
 
G
D
 
D
A
 
P
R
 
A
M
 
V
L
 
L
H
 
K
I
 
A
L
 
A
K
 
Q
R
 
T
L
 
V
R
 
K
A
 
Q
L
 
L
A
 
V
-
 
D
-
 
E
G
 
G
A
 
A
M
 
F
A
 
G
Q
 
K
P
 
G
V
 
F
R
 
S
E
 
S
R
 
V
P
 
S
W
 
Y
T
 
N
E
 
N
V
 
G
A
 
G
R
 
A
S
 
P
-
 
A
-
 
L
M
 
L
V
 
A
S
 
K
G
 
G
E
 
K
A
 
A
A
 
G
M
 
M
L
 
H
I
 
L
M
 
M
G
 
G
D
 
S
W
|
W

Sites not aligning to the query:

4zzeA Raffinose and panose binding protein from bifidobacterium animalis subsp. Lactis bl-04, bound with panose (see paper)
21% identity, 61% coverage: 100:369/446 of query aligns to 38:313/377 of 4zzeA

query
sites
4zzeA
L
 
L
K
 
R
S
 
T
M
 
R
V
 
F
L
 
V
A
 
K
N
 
D
R
 
R
A
 
V
P
 
P
E
 
D
V
 
V
T
 
I
Q
 
T
L
 
F
N
|
N
G
 
G
-
 
D
V
 
Y
V
 
S
F
 
F
G
 
G
E
 
T
W
 
F
A
 
A
D
 
A
L
 
S
G
 
G
L
 
V
L
 
F
L
 
H
E
 
D
L
 
F
D
 
T
N
 
D
V
 
D
A
 
P
V
 
L
Q
 
V
G
 
S
N
 
E
W
 
L
E
 
N
K
 
E
Q
 
G
M
 
M
F
 
V
P
 
N
T
 
I
V
 
A
W
 
K
S
 
N
L
 
L
L
 
V
N
 
Q
N
 
T
H
 
S
G
 
D
H
 
P
V
 
A
V
 
K
A
 
K
A
 
R
P
 
L
L
 
Y
G
 
G
I
 
L
-
 
P
-
 
F
-
 
A
H
 
G
R
 
N
I
 
A
N
 
S
S
 
G
L
 
Y
Y
 
I
Y
 
Y
N
 
N
V
 
K
A
 
D
V
 
L
F
 
F
K
 
R
R
 
K
Y
 
V
N
 
G
L
 
L
-
 
D
-
 
P
-
 
D
S
 
N
P
 
P
P
 
P
K
 
Q
T
 
T
W
 
W
D
 
D
E
 
E
F
 
F
D
 
I
Q
 
A
I
 
M
V
 
L
K
 
K
K
 
K
L
 
F
Q
 
R
G
 
D
S
 
A
G
 
G
V
 
I
V
 
N
P
 
P
L
 
V
-
 
Q
A
 
A
Q
 
T
S
 
L
A
 
A
E
 
D
A
 
A
W
|
W
Q
 
T
-
 
T
-
 
Q
-
x
A
-
 
P
L
 
L
A
 
A
T
 
S
L
 
L
F
 
A
E
 
G
N
 
T
L
 
L
-
 
V
-
 
P
-
 
E
-
 
S
-
 
E
-
 
Y
A
 
A
L
 
A
A
 
L
E
 
K
S
 
S
G
 
G
P
 
D
A
 
T
Y
 
T
Y
 
F
R
 
K
K
 
Q
L
 
I
F
 
W
V
 
T
E
 
E
M
 
-
S
 
-
P
 
P
A
 
I
A
 
-
Y
 
-
L
 
-
D
 
-
A
 
E
R
 
K
M
 
E
L
 
I
H
 
E
I
 
L
L
 
F
K
 
K
R
 
Y
L
 
A
R
 
D
A
 
S
L
 
E
A
 
K
G
 
G
A
 
V
M
 
T
A
 
Y
Q
 
Q
P
 
-
V
 
-
R
 
-
E
 
-
R
 
-
P
 
-
W
 
-
T
 
-
E
 
Q
V
 
G
A
 
T
R
 
Q
S
 
N
M
 
F
V
 
A
S
 
K
G
 
G
E
 
T
A
 
A
A
 
A
M
 
I
L
 
I
I
 
P
M
 
L
G
 
G
D
 
T
W
 
Y
A
 
A
K
 
I
G
 
P
E
 
Q
L
 
I
N
 
T
A
 
M
W
 
V
G
x
N
M
 
K
E
x
D
V
 
I
D
 
D
Q
 
L
Q
 
G
F
 
F
G
 
A
C
 
Q
A
 
M
P
 
P
A
 
A
P
 
T
G
 
N
T
x
D
G
 
A
E
x
S
Y
 
K
H
 
Q
L
 
I
Y
 
L
S
 
T
-
 
A
-
 
G
T
 
D
D
|
D
T
 
V
L
 
I
A
 
L
M
 
T
F
 
M
A
 
G
G
 
A
N
 
N
Y
 
S
A
 
R
H
 
H
Q
 
K
P
 
E
M
 
Q
Q
 
S
E
 
M
T
 
R
L
 
F
A
 
I
R
 
R
L
 
F
T
 
L
M
 
M
S
 
S
P
 
K
A
 
K
V
 
Q
Q
 
L
S
 
E
E
 
N
Y
 
Y
N
 
A
R
 
D
I
 
A
K
 
Q
G
 
S
S
 
A
I
 
I
P
 
T
V
 
P
L
 
L
R
 
K

Sites not aligning to the query:

4zs9A Raffinose and panose binding protein from bifidobacterium animalis subsp. Lactis bl-04, bound with raffinose (see paper)
21% identity, 61% coverage: 100:369/446 of query aligns to 38:313/377 of 4zs9A

query
sites
4zs9A
L
 
L
K
 
R
S
 
T
M
 
R
V
 
F
L
 
V
A
 
K
N
 
D
R
 
R
A
 
V
P
 
P
E
 
D
V
 
V
T
 
I
Q
 
T
L
 
F
N
|
N
G
 
G
-
 
D
V
 
Y
V
 
S
F
 
F
G
 
G
E
 
T
W
 
F
A
 
A
D
 
A
L
 
S
G
 
G
L
 
V
L
 
F
L
 
H
E
 
D
L
 
F
D
 
T
N
 
D
V
 
D
A
 
P
V
 
L
Q
 
V
G
 
S
N
 
E
W
 
L
E
 
N
K
 
E
Q
 
G
M
 
M
F
 
V
P
 
N
T
 
I
V
 
A
W
 
K
S
 
N
L
 
L
L
 
V
N
 
Q
N
 
T
H
 
S
G
 
D
H
 
P
V
 
A
V
 
K
A
 
K
A
 
R
P
 
L
L
 
Y
G
 
G
I
 
L
-
 
P
-
 
F
-
 
A
H
 
G
R
 
N
I
 
A
N
 
S
S
 
G
L
 
Y
Y
 
I
Y
 
Y
N
 
N
V
 
K
A
 
D
V
 
L
F
 
F
K
 
R
R
 
K
Y
 
V
N
 
G
L
 
L
-
 
D
-
 
P
-
 
D
S
 
N
P
 
P
P
 
P
K
 
Q
T
 
T
W
 
W
D
 
D
E
 
E
F
 
F
D
 
I
Q
 
A
I
 
M
V
 
L
K
 
K
K
 
K
L
 
F
Q
 
R
G
 
D
S
 
A
G
 
G
V
 
I
V
 
N
P
 
P
L
 
V
-
 
Q
A
 
A
Q
 
T
S
 
L
A
 
A
E
 
D
A
 
A
W
|
W
Q
 
T
-
 
T
-
 
Q
-
x
A
-
 
P
L
 
L
A
 
A
T
 
S
L
 
L
F
 
A
E
 
G
N
 
T
L
 
L
-
 
V
-
 
P
-
 
E
-
 
S
-
 
E
-
 
Y
A
 
A
L
 
A
A
 
L
E
 
K
S
 
S
G
 
G
P
 
D
A
 
T
Y
 
T
Y
 
F
R
 
K
K
 
Q
L
 
I
F
 
W
V
 
T
E
 
E
M
 
-
S
 
-
P
 
P
A
 
I
A
 
-
Y
 
-
L
 
-
D
 
-
A
 
E
R
 
K
M
 
E
L
 
I
H
 
E
I
 
L
L
 
F
K
 
K
R
 
Y
L
 
A
R
 
D
A
 
S
L
 
E
A
 
K
G
 
G
A
 
V
M
 
T
A
 
Y
Q
 
Q
P
 
-
V
 
-
R
 
-
E
 
-
R
 
-
P
 
-
W
 
-
T
 
-
E
 
Q
V
 
G
A
 
T
R
 
Q
S
 
N
M
 
F
V
 
A
S
 
K
G
 
G
E
 
T
A
 
A
A
 
A
M
 
I
L
 
I
I
 
P
M
 
L
G
 
G
D
 
T
W
x
Y
A
 
A
K
 
I
G
 
P
E
 
Q
L
 
I
N
 
T
A
 
M
W
 
V
G
 
N
M
 
K
E
 
D
V
 
I
D
 
D
Q
 
L
Q
 
G
F
 
F
G
 
A
C
 
Q
A
 
M
P
 
P
A
 
A
P
 
T
G
 
N
T
 
D
G
 
A
E
 
S
Y
 
K
H
 
Q
L
 
I
Y
 
L
S
 
T
-
 
A
-
 
G
T
 
D
D
|
D
T
 
V
L
 
I
A
 
L
M
 
T
F
 
M
A
 
G
G
 
A
N
 
N
Y
 
S
A
 
R
H
 
H
Q
 
K
P
 
E
M
 
Q
Q
 
S
E
 
M
T
 
R
L
 
F
A
 
I
R
 
R
L
 
F
T
 
L
M
 
M
S
 
S
P
 
K
A
 
K
V
 
Q
Q
 
L
S
 
E
E
 
N
Y
 
Y
N
 
A
R
 
D
I
 
A
K
 
Q
G
 
S
S
 
A
I
 
I
P
 
T
V
 
P
L
 
L
R
 
K

Sites not aligning to the query:

4zs9B Raffinose and panose binding protein from bifidobacterium animalis subsp. Lactis bl-04, bound with raffinose (see paper)
21% identity, 61% coverage: 100:369/446 of query aligns to 39:314/378 of 4zs9B

query
sites
4zs9B
L
 
L
K
 
R
S
 
T
M
 
R
V
 
F
L
 
V
A
 
K
N
 
D
R
 
R
A
 
V
P
 
P
E
 
D
V
 
V
T
 
I
Q
 
T
L
 
F
N
|
N
G
 
G
-
 
D
V
 
Y
V
 
S
F
 
F
G
 
G
E
 
T
W
 
F
A
 
A
D
 
A
L
 
S
G
 
G
L
 
V
L
 
F
L
 
H
E
 
D
L
 
F
D
 
T
N
 
D
V
 
D
A
 
P
V
 
L
Q
 
V
G
 
S
N
 
E
W
 
L
E
 
N
K
 
E
Q
 
G
M
 
M
F
 
V
P
 
N
T
 
I
V
 
A
W
 
K
S
 
N
L
 
L
L
 
V
N
 
Q
N
 
T
H
 
S
G
 
D
H
 
P
V
 
A
V
 
K
A
 
K
A
 
R
P
 
L
L
 
Y
G
 
G
I
 
L
-
 
P
-
 
F
-
 
A
H
 
G
R
 
N
I
 
A
N
 
S
S
 
G
L
 
Y
Y
 
I
Y
 
Y
N
 
N
V
 
K
A
 
D
V
 
L
F
 
F
K
 
R
R
 
K
Y
 
V
N
 
G
L
 
L
-
 
D
-
 
P
-
 
D
S
 
N
P
 
P
P
 
P
K
 
Q
T
 
T
W
 
W
D
 
D
E
 
E
F
 
F
D
 
I
Q
 
A
I
 
M
V
 
L
K
 
K
K
 
K
L
 
F
Q
 
R
G
 
D
S
 
A
G
 
G
V
 
I
V
 
N
P
 
P
L
 
V
-
 
Q
A
 
A
Q
 
T
S
 
L
A
 
A
E
 
D
A
 
A
W
|
W
Q
 
T
-
 
T
-
 
Q
-
x
A
-
 
P
L
 
L
A
 
A
T
 
S
L
 
L
F
 
A
E
 
G
N
 
T
L
 
L
-
 
V
-
 
P
-
 
E
-
 
S
-
 
E
-
 
Y
A
 
A
L
 
A
A
 
L
E
 
K
S
 
S
G
 
G
P
 
D
A
 
T
Y
 
T
Y
 
F
R
 
K
K
 
Q
L
 
I
F
 
W
V
 
T
E
 
E
M
 
-
S
 
-
P
 
P
A
 
I
A
 
-
Y
 
-
L
 
-
D
 
-
A
 
E
R
 
K
M
 
E
L
 
I
H
 
E
I
 
L
L
 
F
K
 
K
R
 
Y
L
 
A
R
 
D
A
 
S
L
 
E
A
 
K
G
 
G
A
 
V
M
 
T
A
 
Y
Q
 
Q
P
 
-
V
 
-
R
 
-
E
 
-
R
 
-
P
 
-
W
 
-
T
 
-
E
 
Q
V
 
G
A
 
T
R
 
Q
S
 
N
M
 
F
V
 
A
S
 
K
G
 
G
E
 
T
A
 
A
A
 
A
M
 
I
L
 
I
I
 
P
M
 
L
G
 
G
D
 
T
W
x
Y
A
 
A
K
 
I
G
 
P
E
 
Q
L
 
I
N
 
T
A
 
M
W
 
V
G
 
N
M
 
K
E
 
D
V
 
I
D
 
D
Q
 
L
Q
 
G
F
 
F
G
 
A
C
 
Q
A
 
M
P
 
P
A
 
A
P
 
T
G
 
N
T
 
D
G
 
A
E
 
S
Y
 
K
H
 
Q
L
 
I
Y
 
L
S
 
T
T
 
A
-
 
G
-
 
D
D
|
D
T
 
V
L
 
I
A
 
L
M
 
T
F
 
M
A
 
G
G
 
A
N
 
N
Y
 
S
A
 
R
H
 
H
Q
 
K
P
 
E
M
 
Q
Q
 
S
E
 
M
T
 
R
L
 
F
A
 
I
R
 
R
L
 
F
T
 
L
M
 
M
S
 
S
P
 
K
A
 
K
V
 
Q
Q
 
L
S
 
E
E
 
N
Y
 
Y
N
 
A
R
 
D
I
 
A
K
 
Q
G
 
S
S
 
A
I
 
I
P
 
T
V
 
P
L
 
L
R
 
K

Sites not aligning to the query:

4g68A Biochemical and structural insights into xylan utilization by the thermophilic bacteriumcaldanaerobius polysaccharolyticus (see paper)
24% identity, 44% coverage: 100:294/446 of query aligns to 48:242/392 of 4g68A

query
sites
4g68A
L
 
I
K
 
K
S
 
A
M
 
A
V
 
I
L
 
A
A
 
A
N
 
N
R
 
E
A
 
A
P
 
P
E
 
D
V
 
I
T
 
F
Q
 
Q
L
 
T
N
x
W
G
 
A
V
 
G
V
 
G
F
 
F
G
 
S
E
 
Q
-
 
P
W
 
F
A
 
V
D
 
E
L
 
A
G
 
G
L
 
K
L
 
V
L
 
L
E
 
Q
L
 
L
D
 
D
N
 
S
V
 
Y
A
 
L
V
 
N
Q
 
D
G
 
G
N
 
T
W
 
-
E
 
K
K
 
D
Q
 
Q
M
 
L
F
 
L
P
 
P
T
 
G
V
 
S
W
 
F
S
 
D
L
 
N
L
 
V
N
 
T
N
 
Y
H
 
N
G
 
G
H
 
K
V
 
I
V
 
Y
A
 
G
A
 
I
P
 
P
L
 
F
G
 
D
I
 
-
H
 
Q
R
x
Q
I
 
A
N
 
S
S
 
V
L
 
L
Y
 
Y
Y
 
I
N
 
N
V
 
K
A
 
E
V
 
L
F
 
F
K
 
D
R
 
K
Y
 
Y
N
 
N
L
 
V
S
 
K
P
 
V
P
 
P
K
 
T
T
 
T
W
 
F
D
 
S
E
 
E
F
 
L
D
 
I
Q
 
D
I
 
A
V
 
I
K
 
K
K
 
T
L
 
F
Q
 
K
G
 
S
S
 
K
G
 
G
V
 
V
V
 
T
P
 
P
L
 
F
A
 
A
-
 
L
Q
 
G
S
 
E
A
 
K
E
 
D
A
 
E
W
|
W
Q
 
P
L
 
G
A
 
M
T
x
W
L
 
Y
F
 
Y
E
 
D
N
 
M
L
 
I
A
 
A
L
 
L