SitesBLAST – Find functional sites

 

SitesBLAST

Comparing SM_b20902 FitnessBrowser__Smeli:SM_b20902 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

4ywhA Crystal structure of an abc transporter solute binding protein (ipr025997) from actinobacillus succinogenes 130z (asuc_0499, target efi-511068) with bound d-xylose
45% identity, 89% coverage: 24:331/345 of query aligns to 2:306/310 of 4ywhA

query
sites
4ywhA
K
 
K
D
 
D
L
 
L
V
 
T
I
 
I
G
 
G
V
 
M
S
 
S
W
 
I
S
 
D
N
 
D
F
 
L
Q
 
R
E
x
L
E
 
E
R
|
R
W
 
W
K
 
Q
T
 
K
D
 
D
E
 
R
A
 
D
A
 
I
I
 
F
K
 
V
A
 
K
A
 
K
L
 
A
E
 
E
A
 
S
S
 
L
G
 
G
D
 
A
K
 
K
Y
 
V
I
 
L
S
 
V
A
 
Q
D
 
S
A
 
A
Q
 
N
S
 
G
S
 
D
A
 
D
A
 
S
K
 
A
Q
 
Q
L
 
I
T
 
S
D
 
Q
I
 
I
E
 
E
S
 
N
L
 
M
I
 
L
A
 
N
Q
 
K
G
 
N
A
 
V
N
 
D
A
 
V
L
 
L
I
 
V
V
 
I
L
 
I
A
 
P
Q
 
H
D
 
N
S
 
G
D
 
D
A
 
V
I
 
L
G
 
S
P
 
N
A
 
V
I
 
I
E
 
S
K
 
E
A
 
A
A
 
K
A
 
K
E
 
E
G
 
G
I
 
V
P
 
K
V
 
V
V
 
L
G
 
A
Y
 
Y
D
|
D
R
|
R
L
 
L
I
 
I
E
 
N
N
 
N
P
 
A
D
 
D
A
 
L
-
 
D
F
 
F
Y
 
Y
I
 
V
T
 
S
F
 
F
D
 
D
N
 
N
K
 
E
E
 
K
V
 
V
G
 
G
R
 
E
L
 
L
Q
 
Q
A
 
A
R
 
D
E
 
A
V
 
I
F
 
I
K
 
K
Q
 
E
K
 
K
P
 
P
E
 
E
G
 
G
N
 
N
F
 
Y
V
 
F
F
 
L
I
 
M
K
 
G
G
 
G
S
 
S
S
 
P
A
 
V
D
|
D
P
 
N
N
|
N
A
 
A
D
 
K
F
 
L
L
 
F
F
 
R
S
 
K
G
 
G
Q
 
Q
L
 
M
E
 
K
V
 
V
L
 
L
K
 
Q
E
 
P
A
 
L
I
 
I
D
 
D
A
 
S
G
 
G
K
 
K
I
 
I
K
 
K
N
 
V
V
 
V
G
 
G
E
 
D
A
 
Q
Y
 
W
T
 
V
D
 
D
G
 
S
W
|
W
K
 
L
P
 
A
E
 
E
N
 
K
A
 
A
Q
 
L
K
 
Q
N
 
I
M
 
M
E
 
E
Q
 
N
F
 
A
L
 
L
T
 
T
A
 
A
N
 
N
D
 
K
N
 
N
K
 
N
V
 
I
D
 
D
A
 
A
V
 
V
V
 
V
A
 
A
S
 
S
N
|
N
D
 
D
G
 
A
T
 
T
A
 
A
G
 
G
G
 
G
A
 
A
I
 
I
A
 
Q
A
 
A
L
 
L
D
 
S
A
 
A
Q
 
Q
G
 
G
L
 
L
A
 
S
G
 
G
S
 
K
V
 
V
P
 
A
V
 
I
S
 
S
G
 
G
Q
 
Q
D
|
D
A
 
A
D
 
D
K
 
L
A
 
A
A
 
A
L
 
I
N
 
K
R
 
R
V
 
I
A
 
V
L
 
E
G
 
G
T
 
T
Q
 
Q
T
 
T
V
 
M
S
 
T
V
 
V
W
 
Y
K
|
K
D
 
P
S
 
I
R
 
T
E
 
N
L
 
L
G
 
A
K
 
D
K
 
K
A
 
A
A
 
A
E
 
E
I
 
L
A
 
S
V
 
V
A
 
A
L
 
L
A
 
-
G
 
-
G
 
G
K
 
K
T
 
E
M
 
-
D
 
E
E
 
K
V
 
L
E
 
E
G
 
P
V
 
N
Q
 
A
T
 
K
F
 
L
N
 
N
G
 
N
G
 
G
P
 
L
K
 
K
G
 
E
V
 
V
A
 
-
M
 
-
K
 
D
S
 
A
V
 
Y
F
 
L
L
 
L
A
 
D
P
 
P
L
 
I
A
 
V
I
 
V
T
 
T
K
 
K
D
 
D
N
 
N
L
 
I
N
 
D
-
 
S
V
 
T
V
 
V
I
 
I
D
 
K
A
 
D
G
 
G
W
 
F
I
 
H
S
 
S
K
 
K
E
 
E

3ma0A Closed liganded crystal structure of xylose binding protein from escherichia coli (see paper)
43% identity, 90% coverage: 24:332/345 of query aligns to 1:306/313 of 3ma0A

query
sites
3ma0A
K
 
K
D
 
E
L
 
V
V
 
K
I
 
I
G
 
G
V
 
M
S
 
A
W
 
I
S
 
D
N
 
D
F
 
L
Q
 
R
E
x
L
E
 
E
R
|
R
W
 
W
K
 
Q
T
 
K
D
 
D
E
 
R
A
 
D
A
 
I
I
 
F
K
 
V
A
 
K
A
 
K
L
 
A
E
 
E
A
 
S
S
 
L
G
 
G
D
 
A
K
 
K
Y
 
V
I
 
F
S
 
V
A
 
Q
D
 
S
A
 
A
Q
 
N
S
 
G
S
 
N
A
 
E
A
 
E
K
 
T
Q
 
Q
L
 
M
T
 
S
D
 
Q
I
 
I
E
 
E
S
 
N
L
 
M
I
 
I
A
 
N
Q
 
R
G
 
G
A
 
V
N
 
D
A
 
V
L
 
L
I
 
V
V
 
I
L
 
I
A
 
P
Q
 
Y
D
 
N
S
 
G
D
 
Q
A
 
V
I
 
L
G
 
S
P
 
N
A
 
V
I
 
V
E
 
K
K
 
E
A
 
A
A
 
K
A
 
Q
E
 
E
G
 
G
I
 
I
P
 
K
V
 
V
V
 
L
G
 
A
Y
 
Y
D
|
D
R
|
R
L
 
M
I
 
I
E
 
N
N
 
D
P
 
A
D
 
D
A
 
I
-
 
D
F
 
F
Y
 
Y
I
 
I
T
 
S
F
 
F
D
 
D
N
 
N
K
 
E
E
 
K
V
 
V
G
 
G
R
 
E
L
 
L
Q
 
Q
A
 
A
R
 
K
E
 
A
V
 
L
F
 
V
K
 
D
Q
 
I
K
 
V
P
 
P
E
 
Q
G
 
G
N
 
N
F
 
Y
V
 
F
F
 
L
I
 
M
K
 
G
G
 
G
S
 
S
S
 
P
A
 
V
D
|
D
P
 
N
N
|
N
A
 
A
D
 
K
F
 
L
L
 
F
F
 
R
S
 
A
G
 
G
Q
 
Q
L
 
M
E
 
K
V
 
V
L
 
L
K
 
K
E
 
P
A
 
Y
I
 
V
D
 
D
A
 
S
G
 
G
K
 
K
I
 
I
K
 
K
N
 
V
V
 
V
G
 
G
E
 
D
A
 
Q
Y
 
W
T
 
V
D
 
D
G
 
G
W
|
W
K
 
L
P
 
P
E
 
E
N
 
N
A
 
A
Q
 
L
K
 
K
N
 
I
M
 
M
E
 
E
Q
 
N
F
 
A
L
 
L
T
 
T
A
 
A
N
 
N
D
 
N
N
 
N
K
 
K
V
 
I
D
 
D
A
 
A
V
 
V
V
 
V
A
 
A
S
 
S
N
|
N
D
 
D
G
 
A
T
 
T
A
 
A
G
 
G
G
 
G
A
 
A
I
 
I
A
 
Q
A
 
A
L
 
L
D
 
S
A
 
A
Q
 
Q
G
 
G
L
 
L
A
 
S
G
 
G
S
 
K
V
 
V
P
 
A
V
 
I
S
 
S
G
 
G
Q
 
Q
D
|
D
A
 
A
D
 
D
K
 
L
A
 
A
A
 
G
L
 
I
N
 
K
R
 
R
V
 
I
A
 
A
L
 
A
G
 
G
T
 
T
Q
 
Q
T
 
T
V
 
M
S
 
T
V
 
V
W
 
Y
K
|
K
D
 
P
S
 
I
R
 
T
E
 
L
L
 
L
G
 
A
K
 
N
K
 
T
A
 
A
A
 
A
E
 
E
I
 
I
A
 
A
V
 
V
A
 
E
L
 
L
A
 
G
G
 
N
G
 
G
K
 
Q
T
 
-
M
 
-
D
 
-
E
 
E
V
 
P
E
 
K
G
 
A
V
 
D
Q
 
T
T
 
T
F
 
L
N
 
N
G
 
N
G
 
G
P
 
L
K
 
K
G
 
D
V
 
V
A
 
P
M
 
-
K
 
-
S
 
S
V
 
R
F
 
L
L
 
L
A
 
T
P
 
P
L
 
I
A
 
D
I
 
V
T
 
N
K
 
K
D
 
N
N
 
N
L
 
I
-
 
K
N
 
D
V
 
T
V
 
V
I
 
I
D
 
K
A
 
D
G
 
G
W
 
F
I
 
H
S
 
K
K
 
E
E
 
S
E
 
E

3uugA Crystal structure of the periplasmic sugar binding protein chve (see paper)
33% identity, 88% coverage: 28:332/345 of query aligns to 5:327/329 of 3uugA

query
sites
3uugA
I
 
V
G
 
G
V
 
I
S
 
A
W
 
M
S
 
P
N
 
T
F
 
K
Q
 
S
E
 
S
E
 
A
R
|
R
W
 
W
K
 
I
T
 
D
D
 
D
E
 
G
A
 
N
A
 
N
I
 
I
K
 
V
A
 
K
A
 
Q
L
 
L
E
 
Q
A
 
E
S
 
A
G
 
G
D
 
Y
K
 
K
Y
 
T
I
 
D
S
 
L
A
 
Q
D
 
Y
A
 
A
Q
 
D
S
 
D
S
 
D
A
 
I
A
 
P
K
 
N
Q
 
Q
L
 
L
T
 
S
D
 
Q
I
 
I
E
 
E
S
 
N
L
 
M
I
 
V
A
 
T
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
V
L
 
L
I
 
V
V
 
I
L
 
A
A
 
S
Q
 
I
D
 
D
S
 
G
D
 
T
A
 
T
I
 
L
G
 
S
P
 
D
A
 
V
I
 
L
E
 
K
K
 
Q
A
 
A
A
 
G
A
 
E
E
 
Q
G
 
G
I
 
I
P
 
K
V
 
V
V
 
I
G
 
A
Y
 
Y
D
|
D
R
|
R
L
 
L
I
 
I
E
 
R
N
 
N
P
 
S
D
 
G
-
 
D
-
 
V
A
 
S
F
 
Y
Y
 
Y
I
 
A
T
 
T
F
 
F
D
 
D
N
 
N
K
 
F
E
 
Q
V
 
V
G
 
G
R
 
V
L
 
L
Q
 
Q
A
 
A
R
 
T
E
 
S
V
 
I
F
 
T
K
 
D
Q
 
K
-
 
L
-
 
G
-
 
L
-
 
K
-
 
D
-
 
G
K
 
K
P
 
G
E
 
P
G
 
F
N
 
N
F
 
I
V
 
E
F
 
L
I
 
F
K
 
G
G
 
G
S
 
S
S
 
P
A
 
D
D
|
D
P
 
N
N
|
N
A
 
A
D
 
F
F
 
F
L
 
F
F
 
Y
S
 
D
G
 
G
Q
 
A
L
 
M
E
 
S
V
 
V
L
 
L
K
 
K
E
 
P
A
 
Y
I
 
I
D
 
D
A
 
S
G
 
G
K
 
K
I
 
L
-
 
V
-
 
V
-
 
K
-
 
S
-
 
G
-
 
Q
K
 
M
N
 
G
V
 
M
G
 
D
E
 
K
A
 
V
Y
 
G
T
 
T
D
 
L
G
 
R
W
|
W
K
 
D
P
 
P
E
 
A
N
 
T
A
 
A
Q
 
Q
K
 
A
N
 
R
M
 
M
E
 
D
Q
 
N
F
 
L
L
 
L
T
 
S
A
 
A
-
 
Y
-
 
Y
N
 
T
D
 
D
N
 
A
K
 
K
V
 
V
D
 
D
A
 
A
V
 
V
V
 
L
A
 
S
S
 
P
N
x
Y
D
 
D
G
 
G
T
 
L
A
 
S
G
 
I
G
 
G
A
 
I
I
 
I
A
 
S
A
 
S
L
 
L
D
 
K
A
 
G
Q
 
V
G
 
G
L
 
Y
A
 
G
G
 
T
-
 
K
-
 
D
-
 
Q
S
 
P
V
 
L
P
 
P
-
 
V
V
 
V
S
 
S
G
 
G
Q
 
Q
D
|
D
A
 
A
D
 
E
K
 
V
A
 
P
A
 
S
L
 
V
N
 
K
R
 
S
V
 
I
A
 
I
L
 
A
G
 
G
T
 
E
Q
 
Q
T
 
Y
V
 
S
S
 
T
V
 
I
W
 
F
K
|
K
D
 
D
S
 
T
R
 
R
E
 
E
L
 
L
G
 
A
K
 
K
K
 
V
A
 
T
A
 
V
E
 
N
I
 
M
A
 
V
V
 
N
A
 
A
L
 
V
A
 
M
G
 
E
G
 
G
K
 
K
T
 
E
M
 
-
D
 
P
E
 
E
V
 
V
E
 
N
G
 
D
V
 
T
Q
 
K
T
 
T
F
 
Y
N
 
E
G
 
N
G
 
G
P
 
V
K
 
K
G
 
V
V
 
V
A
 
P
M
 
-
K
 
-
S
 
S
V
 
Y
F
 
L
L
 
L
A
 
K
P
 
P
L
 
V
A
 
A
I
 
V
T
 
T
K
 
K
D
 
E
N
 
N
L
 
Y
-
 
K
N
 
Q
V
 
V
V
 
L
I
 
V
D
 
D
A
 
G
G
 
G
W
 
Y
I
 
Y
S
 
K
K
 
E
E
 
D
E
 
Q

3urmA Crystal structure of the periplasmic sugar binding protein chve (see paper)
33% identity, 88% coverage: 28:332/345 of query aligns to 5:327/329 of 3urmA

query
sites
3urmA
I
 
V
G
 
G
V
 
I
S
 
A
W
 
M
S
 
P
N
 
T
F
 
K
Q
 
S
E
 
S
E
 
A
R
|
R
W
 
W
K
 
I
T
 
D
D
 
D
E
 
G
A
 
N
A
 
N
I
 
I
K
 
V
A
 
K
A
 
Q
L
 
L
E
 
Q
A
 
E
S
 
A
G
 
G
D
 
Y
K
 
K
Y
 
T
I
 
D
S
 
L
A
 
Q
D
 
Y
A
 
A
Q
 
D
S
 
D
S
 
D
A
 
I
A
 
P
K
 
N
Q
 
Q
L
 
L
T
 
S
D
 
Q
I
 
I
E
 
E
S
 
N
L
 
M
I
 
V
A
 
T
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
V
L
 
L
I
 
V
V
 
I
L
 
A
A
 
S
Q
 
I
D
 
D
S
 
G
D
 
T
A
 
T
I
 
L
G
 
S
P
 
D
A
 
V
I
 
L
E
 
K
K
 
Q
A
 
A
A
 
G
A
 
E
E
 
Q
G
 
G
I
 
I
P
 
K
V
 
V
V
 
I
G
 
A
Y
 
Y
D
|
D
R
|
R
L
 
L
I
 
I
E
 
R
N
 
N
P
 
S
D
 
G
-
 
D
-
 
V
A
 
S
F
 
Y
Y
 
Y
I
 
A
T
 
T
F
 
F
D
 
D
N
 
N
K
 
F
E
 
Q
V
 
V
G
 
G
R
 
V
L
 
L
Q
 
Q
A
 
A
R
 
T
E
 
S
V
 
I
F
 
T
K
 
D
Q
 
K
-
 
L
-
 
G
-
 
L
-
 
K
-
 
D
-
 
G
K
 
K
P
 
G
E
 
P
G
 
F
N
 
N
F
 
I
V
 
E
F
 
L
I
 
F
K
 
G
G
 
G
S
 
S
S
 
P
A
 
D
D
|
D
P
 
N
N
|
N
A
 
A
D
 
F
F
 
F
L
 
F
F
 
Y
S
 
D
G
 
G
Q
 
A
L
 
M
E
 
S
V
 
V
L
 
L
K
 
K
E
 
P
A
 
Y
I
 
I
D
 
D
A
 
S
G
 
G
K
 
K
I
 
L
-
 
V
-
 
V
-
 
K
-
 
S
-
 
G
-
 
Q
K
 
M
N
 
G
V
 
M
G
 
D
E
 
K
A
 
V
Y
 
G
T
 
T
D
 
L
G
 
R
W
|
W
K
 
D
P
 
P
E
 
A
N
 
T
A
 
A
Q
 
Q
K
 
A
N
 
R
M
 
M
E
 
D
Q
 
N
F
 
L
L
 
L
T
 
S
A
 
A
-
 
Y
-
 
Y
N
 
T
D
 
D
N
 
A
K
 
K
V
 
V
D
 
D
A
 
A
V
 
V
V
 
L
A
 
S
S
 
P
N
 
Y
D
 
D
G
 
G
T
 
L
A
 
S
G
 
I
G
 
G
A
 
I
I
 
I
A
 
S
A
 
S
L
 
L
D
 
K
A
 
G
Q
 
V
G
 
G
L
 
Y
A
 
G
G
 
T
-
 
K
-
 
D
-
 
Q
S
 
P
V
 
L
P
 
P
-
 
V
V
 
V
S
 
S
G
 
G
Q
 
Q
D
|
D
A
 
A
D
 
E
K
 
V
A
 
P
A
 
S
L
 
V
N
 
K
R
 
S
V
 
I
A
 
I
L
 
A
G
 
G
T
 
E
Q
 
Q
T
 
Y
V
 
S
S
 
T
V
 
I
W
 
F
K
|
K
D
 
D
S
 
T
R
 
R
E
 
E
L
 
L
G
 
A
K
 
K
K
 
V
A
 
T
A
 
V
E
 
N
I
 
M
A
 
V
V
 
N
A
 
A
L
 
V
A
 
M
G
 
E
G
 
G
K
 
K
T
 
E
M
 
-
D
 
P
E
 
E
V
 
V
E
 
N
G
 
D
V
 
T
Q
 
K
T
 
T
F
 
Y
N
 
E
G
 
N
G
 
G
P
 
V
K
 
K
G
 
V
V
 
V
A
 
P
M
 
-
K
 
-
S
 
S
V
 
Y
F
 
L
L
 
L
A
 
K
P
 
P
L
 
V
A
 
A
I
 
V
T
 
T
K
 
K
D
 
E
N
 
N
L
 
Y
-
 
K
N
 
Q
V
 
V
V
 
L
I
 
V
D
 
D
A
 
G
G
 
G
W
 
Y
I
 
Y
S
 
K
K
 
E
E
 
D
E
 
Q

4wwhA Crystal structure of an abc transporter solute binding protein (ipr025997) from mycobacterium smegmatis (msmeg_1704, target efi- 510967) with bound d-galactose
32% identity, 88% coverage: 28:332/345 of query aligns to 5:327/329 of 4wwhA

query
sites
4wwhA
I
 
V
G
 
G
V
 
I
S
 
A
W
 
M
S
 
P
N
 
T
F
 
K
Q
 
S
E
 
S
E
 
E
R
|
R
W
 
W
K
 
V
T
 
A
D
 
D
E
 
G
A
 
Q
A
 
N
I
 
M
K
 
V
A
 
D
A
 
Q
L
 
F
E
 
K
A
 
A
S
 
F
G
 
G
D
 
Y
K
 
D
Y
 
T
I
 
D
S
 
L
A
 
Q
D
 
Y
A
 
G
Q
 
D
S
 
D
S
 
V
A
 
V
A
 
Q
K
 
N
Q
 
Q
L
 
V
T
 
S
D
 
Q
I
 
I
E
 
E
S
 
N
L
 
M
I
 
I
A
 
T
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
L
L
 
L
I
 
V
V
 
I
L
 
A
A
 
P
Q
 
I
D
 
D
S
 
G
D
 
S
A
 
S
I
 
L
G
 
T
P
 
N
A
 
T
I
 
L
E
 
Q
K
 
H
A
 
A
A
 
A
A
 
D
E
 
L
G
 
K
I
 
I
P
 
P
V
 
V
V
 
I
G
 
S
Y
 
Y
D
|
D
R
|
R
L
 
L
I
 
I
E
 
K
-
 
G
N
 
T
P
 
P
D
 
N
A
 
V
-
 
D
F
 
Y
Y
 
Y
I
 
A
T
 
T
F
 
F
D
 
D
N
 
N
K
 
T
E
 
K
V
 
V
G
 
G
R
 
V
L
 
L
Q
 
Q
A
 
A
R
 
N
E
 
Y
V
 
I
F
 
V
K
 
D
Q
 
T
-
 
L
-
 
G
-
 
V
-
 
A
-
 
D
-
 
G
K
 
K
P
 
G
E
 
P
G
 
F
N
 
N
F
 
L
V
 
E
F
 
L
I
 
F
K
 
A
G
 
G
S
 
S
S
 
P
A
 
D
D
|
D
P
 
N
N
|
N
A
 
A
D
 
T
F
 
Y
L
 
F
F
 
F
S
 
Q
G
 
G
Q
 
A
L
 
M
E
 
S
V
 
V
L
 
L
K
 
Q
E
 
P
A
 
Y
I
 
I
D
 
D
A
 
S
G
 
G
K
 
K
I
 
L
-
 
V
-
 
V
-
 
K
-
 
S
-
 
G
-
 
Q
K
 
T
N
 
T
V
 
F
G
 
D
E
 
Q
A
 
I
Y
 
A
T
 
T
D
 
L
G
 
R
W
|
W
K
 
D
P
 
G
E
 
G
N
 
L
A
 
A
Q
 
Q
K
 
S
N
 
R
M
 
M
E
 
D
Q
 
N
F
 
L
L
 
L
T
 
S
-
 
Q
-
 
A
A
 
Y
N
 
T
D
 
S
N
 
G
K
 
R
V
 
V
D
 
D
A
 
A
V
 
V
V
 
L
A
 
S
S
 
P
N
 
Y
D
 
D
G
 
G
T
 
I
A
 
S
G
 
R
G
 
G
A
 
V
I
 
I
A
 
S
A
 
A
L
 
L
D
 
K
A
 
S
Q
 
A
G
 
G
L
 
Y
-
 
G
-
 
N
-
 
A
A
 
A
G
 
K
S
 
P
V
 
L
P
 
P
-
 
I
V
 
V
S
 
T
G
 
G
Q
 
Q
D
|
D
A
 
A
D
 
E
K
 
L
A
 
A
A
 
S
L
 
V
N
 
K
R
 
S
V
 
I
A
 
V
L
 
A
G
 
G
T
 
E
Q
 
Q
T
 
T
V
 
Q
S
 
T
V
 
V
W
 
F
K
|
K
D
 
D
S
 
T
R
 
R
E
 
E
L
 
L
G
 
A
K
 
K
K
 
A
A
 
A
A
 
V
E
 
Q
I
 
E
A
 
A
V
 
D
A
 
A
L
 
V
A
 
L
G
 
T
G
 
G
K
 
G
T
 
T
M
 
-
D
 
P
E
 
Q
V
 
V
E
 
N
G
 
D
V
 
T
Q
 
E
T
 
T
F
 
Y
N
 
D
G
 
N
G
 
G
P
 
V
K
 
K
G
 
-
V
 
-
A
 
V
M
 
V
K
 
P
S
 
S
V
 
Y
F
 
L
L
 
L
A
 
D
P
 
P
L
 
V
A
 
S
I
 
V
T
 
D
K
 
K
D
 
S
N
 
N
L
 
Y
-
 
K
N
 
K
V
 
V
V
 
L
I
 
I
D
 
D
A
 
S
G
 
G
W
 
Y
I
 
Y
S
 
T
K
 
E
E
 
T
E
 
Q

4ys6A Crystal structure of an abc transporter solute binding protein (ipr025997) from clostridium phytofermentans (cphy_1585, target efi- 511156) with bound beta-d-glucose
31% identity, 89% coverage: 27:332/345 of query aligns to 2:322/324 of 4ys6A

query
sites
4ys6A
V
 
L
I
 
V
G
 
G
V
 
V
S
 
A
W
 
M
S
 
P
N
 
T
F
 
K
Q
 
D
E
 
L
E
 
Q
R
|
R
W
|
W
K
 
N
T
 
Q
D
 
D
E
 
G
A
 
S
A
 
N
I
 
M
K
 
E
A
 
K
A
 
Q
L
 
L
E
 
K
A
 
D
S
 
A
G
 
G
D
 
Y
-
 
E
-
 
V
-
 
D
-
 
L
K
 
Q
Y
 
Y
I
 
A
S
 
S
A
 
N
D
 
D
A
 
V
Q
 
Q
S
 
T
S
 
-
A
 
-
A
 
-
K
 
-
Q
 
Q
L
 
V
T
 
S
D
 
Q
I
 
I
E
 
E
S
 
N
L
 
M
I
 
I
A
 
S
Q
 
N
G
 
G
A
 
C
N
 
K
A
 
L
L
 
L
I
 
V
V
 
I
L
 
A
A
 
S
Q
 
I
D
 
E
S
 
G
D
 
D
A
 
S
I
 
L
G
 
G
P
 
T
A
 
V
I
 
L
E
 
A
K
 
Q
A
 
A
A
 
K
A
 
K
E
 
K
G
 
G
I
 
I
P
 
S
V
 
V
V
 
I
G
 
A
Y
 
Y
D
|
D
R
|
R
L
 
L
I
 
I
E
 
M
N
 
N
P
 
S
D
 
D
A
 
A
-
 
V
-
 
S
F
 
Y
Y
 
Y
I
 
A
T
 
T
F
 
F
D
 
D
N
 
N
K
 
Y
E
 
M
V
 
V
G
 
G
R
 
T
L
 
K
Q
 
Q
A
 
G
R
 
E
E
 
Y
V
 
I
F
 
K
K
 
E
Q
 
K
-
 
L
-
 
N
-
 
L
-
 
E
-
 
T
-
 
A
K
 
K
P
 
G
E
 
P
G
 
F
N
 
N
F
 
L
V
 
E
F
 
I
I
 
F
K
 
T
G
 
G
S
 
D
S
 
P
A
 
G
D
|
D
P
 
N
N
|
N
A
 
A
D
 
R
F
 
F
L
 
F
F
 
Y
S
 
G
G
 
G
Q
 
A
L
 
M
E
 
D
V
 
V
L
 
L
K
 
K
E
 
P
A
 
Y
I
 
V
D
 
D
A
 
G
G
 
G
-
 
V
-
 
L
K
 
V
I
 
V
K
 
K
N
 
S
V
 
G
G
 
S
E
 
V
A
 
A
Y
 
F
-
 
E
-
 
K
-
 
V
-
 
A
T
 
T
D
 
A
G
 
G
W
|
W
K
 
S
P
 
T
E
 
E
N
 
T
A
 
A
Q
 
Q
K
 
N
N
 
R
M
 
M
E
 
D
Q
 
A
F
 
I
L
 
I
-
 
A
-
 
S
-
 
Y
T
 
Y
A
 
A
N
 
D
D
 
G
N
 
T
K
 
K
V
 
L
D
 
D
A
 
A
V
 
V
V
 
L
A
 
C
S
 
S
N
|
N
D
 
D
G
 
S
T
 
T
A
 
A
G
 
L
G
 
G
A
 
V
I
 
T
A
 
N
A
 
A
L
 
L
D
 
T
A
 
A
Q
 
S
G
 
-
L
 
Y
A
 
K
G
 
G
S
 
E
V
 
W
P
 
P
-
 
I
V
 
V
S
 
T
G
 
G
Q
 
Q
D
|
D
A
 
C
D
 
D
K
 
I
A
 
A
A
 
N
L
 
V
N
 
K
R
 
N
V
 
M
A
 
L
L
 
D
G
 
G
T
 
K
Q
 
Q
T
 
S
V
 
M
S
 
S
V
 
I
W
 
F
K
|
K
D
 
D
S
 
T
R
 
R
E
 
T
L
 
L
G
 
A
K
 
S
K
 
Q
A
 
V
A
 
V
E
 
K
I
 
M
A
 
V
V
 
D
A
 
A
-
 
I
L
 
M
A
 
K
G
 
G
G
 
G
K
 
E
T
 
A
M
 
-
D
 
-
E
 
P
V
 
V
E
 
N
G
 
D
V
 
T
Q
 
K
T
 
S
F
 
Y
N
 
D
G
 
N
G
 
G
P
 
-
K
 
N
G
 
G
V
 
I
A
 
-
M
 
V
K
 
P
S
 
S
V
 
Y
F
 
L
L
 
C
A
 
E
P
 
P
L
 
V
A
 
F
I
 
A
T
 
D
K
 
A
D
 
T
N
 
N
L
 
Y
N
 
K
-
 
E
V
 
L
V
 
L
I
 
I
D
 
D
A
 
S
G
 
G
W
 
Y
I
 
Y
S
 
T
K
 
E
E
 
D
E
 
Q

4rxuA Crystal structure of carbohydrate transporter solute binding protein caur_1924 from chloroflexus aurantiacus, target efi-511158, in complex with d-glucose
33% identity, 89% coverage: 24:329/345 of query aligns to 2:332/340 of 4rxuA

query
sites
4rxuA
K
 
Q
D
 
Q
L
 
L
V
 
A
I
 
V
G
 
G
V
 
I
S
 
V
W
 
L
S
 
P
N
 
T
F
 
K
Q
 
D
E
|
E
E
 
P
R
|
R
W
 
W
K
 
I
T
 
Q
D
 
D
E
 
E
A
 
T
A
 
R
I
 
F
K
 
R
A
 
E
A
 
A
L
 
L
E
 
Q
A
 
Q
S
 
A
G
 
G
D
 
Y
K
 
Q
Y
 
V
I
 
E
S
 
I
A
 
L
D
 
F
A
 
S
Q
 
Q
S
 
G
S
 
S
A
 
S
A
 
A
K
 
K
Q
 
E
L
 
K
T
 
E
D
 
N
I
 
V
E
 
E
S
 
A
L
 
L
I
 
I
A
 
A
Q
 
K
G
 
G
A
 
I
N
 
K
A
 
V
L
 
L
I
 
I
V
 
I
L
 
C
A
 
P
Q
 
H
D
 
D
S
 
G
D
 
T
A
 
A
I
 
A
G
 
A
P
 
A
A
 
A
I
 
A
E
 
E
K
 
A
A
 
A
A
 
R
A
 
A
E
 
A
G
 
G
I
 
V
P
 
K
V
 
V
V
 
I
G
 
S
Y
 
Y
D
|
D
R
|
R
L
 
L
I
 
I
E
 
R
N
 
E
P
 
T
D
 
D
A
 
A
-
 
V
-
 
D
F
 
Y
Y
 
Y
I
 
V
T
 
T
F
 
F
D
 
D
N
 
S
K
 
I
E
 
A
V
 
V
G
 
G
R
 
A
L
 
Q
Q
 
Q
A
 
A
R
 
Q
E
 
Y
V
 
L
F
 
V
K
 
D
Q
 
H
K
 
A
P
 
S
-
 
G
E
 
T
G
 
G
N
 
N
F
 
P
V
 
L
F
 
Y
I
 
L
K
 
Y
-
 
A
G
 
G
S
 
A
S
 
A
A
 
S
D
|
D
P
 
N
N
|
N
A
 
A
D
 
F
F
 
L
L
 
F
F
 
F
S
 
E
G
 
G
Q
 
A
L
 
W
E
 
K
V
 
V
L
 
L
K
 
Q
E
 
P
A
 
K
I
 
I
D
 
A
A
 
D
G
 
G
K
 
T
-
 
F
-
 
V
I
 
I
K
 
K
N
 
N
V
 
S
G
 
S
E
 
E
A
 
A
-
 
V
-
 
A
-
 
L
-
 
Q
-
 
N
-
 
K
-
 
L
-
 
D
-
 
L
-
 
T
-
 
R
-
 
D
-
 
E
-
 
M
-
 
A
-
 
K
-
 
I
-
 
I
-
 
G
-
 
Q
Y
 
V
T
 
T
D
 
T
G
 
N
W
|
W
K
 
D
P
 
F
E
 
N
N
 
T
A
 
A
Q
 
K
K
 
N
N
 
L
M
 
A
E
 
E
Q
 
A
F
 
N
L
 
L
T
 
T
-
 
A
-
 
A
-
 
T
-
 
A
A
 
A
N
 
D
D
 
K
N
 
G
K
 
K
V
 
V
D
 
-
A
 
Y
V
 
I
V
 
L
A
 
A
S
 
P
N
|
N
D
 
D
G
 
G
T
 
T
A
 
A
G
 
R
G
 
A
A
 
I
I
 
A
A
 
D
A
 
A
L
 
F
D
 
A
A
 
A
Q
 
D
G
 
K
L
 
D
A
 
V
G
 
T
S
 
E
V
 
Y
P
 
F
V
 
V
S
 
T
G
 
G
Q
 
Q
D
|
D
A
 
A
D
 
E
K
 
K
A
 
A
A
 
S
L
 
V
N
 
Q
R
 
Y
V
 
I
A
 
I
L
 
D
G
 
G
T
 
R
Q
 
Q
T
 
S
V
 
M
S
 
T
V
 
V
W
 
F
K
|
K
D
 
D
S
 
V
R
 
R
E
 
T
L
 
L
G
 
V
K
 
Q
K
 
D
A
 
A
A
 
I
E
 
K
I
 
A
A
 
A
V
 
V
A
 
A
L
 
L
A
 
L
G
 
Q
G
 
D
K
 
Q
T
 
-
M
 
-
D
 
-
E
 
Q
V
 
P
E
 
E
G
 
A
V
 
R
Q
 
G
T
 
T
F
 
Y
N
 
N
G
 
N
G
 
G
P
 
K
K
 
K
G
 
D
V
 
V
-
 
P
A
 
A
M
 
I
K
 
Q
S
 
S
V
 
-
F
 
-
L
 
-
A
 
P
P
 
V
L
 
V
A
 
T
I
 
V
T
 
T
K
 
R
D
 
D
N
 
N
L
 
V
N
 
R
-
 
A
V
 
A
V
 
L
I
 
I
D
 
D
A
 
S
G
 
G
W
 
Y
I
 
Y
S
 
S

P0AEE5 D-galactose/methyl-galactoside binding periplasmic protein MglB; D-galactose-binding periplasmic protein; GBP; D-galactose/D-glucose-binding protein; GGBP from Escherichia coli (strain K12) (see 4 papers)
31% identity, 81% coverage: 6:284/345 of query aligns to 4:299/332 of P0AEE5

query
sites
P0AEE5
K
|
K
L
x
V
M
x
L
A
x
T
G
x
L
A
x
S
A
|
A
I
x
V
I
x
M
A
|
A
S
|
S
M
|
M
H
x
L
-
x
F
-
x
G
S
x
A
A
|
A
A
|
A
I
x
H
A
|
A
K
 
A
D
 
D
L
 
T
V
 
R
I
 
I
G
 
G
V
 
V
S
 
T
W
 
I
S
 
Y
N
 
K
F
 
Y
Q
 
D
E
x
D
E
 
N
R
 
F
W
 
M
K
 
S
T
 
V
D
 
V
E
 
R
A
 
K
A
 
A
I
 
I
K
 
E
A
 
Q
A
 
D
L
 
A
E
 
K
A
 
A
S
 
A
G
 
P
D
 
D
-
 
V
K
 
Q
Y
 
L
I
 
L
S
 
M
A
 
N
D
 
D
A
 
S
Q
 
Q
S
 
N
S
 
D
A
 
Q
A
 
S
K
 
K
Q
 
Q
L
 
N
T
 
D
D
 
Q
I
 
I
E
 
D
S
 
V
L
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
A
L
 
L
I
 
A
V
 
I
L
 
N
A
 
L
Q
 
V
D
 
D
S
 
P
D
 
A
A
 
A
I
 
A
G
 
G
P
 
T
A
 
V
I
 
I
E
 
E
K
 
K
A
 
A
A
 
R
A
 
G
E
 
Q
G
 
N
I
 
V
P
 
P
V
 
V
V
 
V
G
 
F
Y
 
F
D
x
N
R
 
K
-
 
E
-
 
P
-
 
S
-
 
R
-
 
K
-
 
A
L
 
L
I
 
D
E
 
S
N
 
Y
P
 
D
D
 
K
A
 
A
F
 
Y
Y
 
Y
I
 
V
T
 
G
F
 
T
D
 
D
N
 
S
K
 
K
E
 
E
V
 
S
G
 
G
R
 
I
L
 
I
Q
 
Q
A
 
G
R
 
D
E
 
L
V
 
I
F
 
A
K
 
K
Q
 
H
-
 
W
-
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
K
x
N
P
 
K
E
x
D
G
 
G
-
x
Q
-
 
I
N
x
Q
F
 
F
V
 
V
F
 
L
I
 
L
K
 
K
G
 
G
S
 
E
S
 
P
A
 
G
D
x
H
P
 
P
N
x
D
A
 
A
D
 
E
F
 
-
L
 
-
F
 
-
S
 
A
G
x
R
Q
 
T
L
 
T
E
 
Y
V
 
V
L
 
I
K
 
K
E
 
E
A
 
L
I
 
N
D
 
D
A
 
K
G
 
G
K
 
I
I
 
K
K
 
T
N
 
E
V
 
Q
G
 
L
E
 
Q
A
 
L
Y
 
D
T
 
T
D
 
A
G
 
M
W
 
W
K
 
D
P
 
T
E
 
A
N
 
Q
A
 
A
Q
 
K
K
 
D
N
 
K
M
 
M
E
 
D
Q
 
A
F
 
W
L
 
L
T
 
S
A
 
G
-
 
P
N
 
N
D
 
A
N
 
N
K
 
K
V
 
I
D
x
E
A
 
V
V
 
V
V
 
I
A
 
A
S
 
N
N
|
N
D
 
D
G
 
A
T
 
M
A
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
L
 
L
D
 
K
A
 
A
Q
 
H
G
 
N
L
 
-
A
 
K
G
 
S
S
 
S
V
 
I
P
 
P
V
 
V
S
 
F
G
 
G
Q
 
V
D
|
D
A
 
A
D
 
L
K
 
P
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
V
A
 
K
L
 
S
G
 
G
T
 
A
Q
 
L
T
 
A
V
 
G
S
 
T
V
 
V
W
 
L
K
x
N
D
 
D
S
 
A
R
 
N
E
 
N
L
 
Q
G
 
A
K
 
K
K
 
A
A
 
T
A
 
F
E
 
D
I
 
L
A
 
A
V
 
K
A
 
N
L
 
L
A
 
A
G
 
D
G
 
G
K
 
K

Sites not aligning to the query:

6s3tA P46, an immunodominant surface protein from mycoplasma hyopneumoniae (see paper)
28% identity, 68% coverage: 85:320/345 of query aligns to 72:372/374 of 6s3tA

query
sites
6s3tA
L
 
F
I
 
I
V
 
I
L
 
A
A
 
P
Q
 
E
D
 
N
S
 
G
D
 
S
A
 
G
I
 
V
G
 
G
P
 
T
A
 
A
I
 
V
E
 
N
K
 
T
A
 
I
A
 
A
A
 
D
E
 
K
G
 
G
I
 
I
P
 
P
V
 
I
V
 
V
G
 
A
Y
 
Y
D
|
D
R
|
R
L
 
L
I
 
I
E
 
T
N
 
G
P
 
S
D
 
D
A
 
K
F
 
Y
-
 
D
-
 
W
Y
 
Y
I
 
V
T
 
S
F
 
F
D
 
D
N
 
N
K
 
E
E
 
K
V
 
V
G
 
G
R
 
E
L
 
L
Q
 
Q
A
 
G
-
 
L
-
 
S
-
 
L
-
 
A
-
 
A
-
 
G
-
 
L
-
 
L
-
 
G
-
 
K
-
 
E
-
 
D
-
 
G
-
 
A
-
 
F
-
 
D
-
 
S
-
 
I
-
 
D
-
 
Q
-
 
M
R
 
N
E
 
E
V
 
Y
F
 
L
K
 
K
-
 
S
Q
 
H
K
 
M
P
 
P
E
 
Q
G
 
E
N
 
T
F
 
I
V
 
S
F
 
F
-
 
Y
-
 
T
I
 
I
K
 
A
G
 
G
S
 
S
S
 
Q
A
 
D
D
|
D
P
 
N
N
 
N
A
 
S
D
 
Q
F
 
Y
L
 
F
F
 
Y
S
 
N
G
 
G
Q
 
A
L
 
M
E
 
K
V
 
V
L
 
L
K
 
K
E
 
E
A
 
L
I
 
M
D
 
K
A
 
N
G
 
S
K
 
Q
I
 
N
K
 
K
N
 
I
V
 
I
-
 
D
-
 
L
-
 
S
-
 
P
-
 
E
G
 
G
E
 
E
-
 
N
-
 
A
A
 
V
Y
 
Y
T
 
V
D
 
P
G
 
G
W
 
W
K
 
N
P
 
Y
E
 
G
N
 
T
A
 
A
Q
 
G
K
 
Q
N
 
R
M
 
I
E
 
Q
Q
 
S
F
 
F
L
 
L
T
 
T
A
 
I
N
 
N
D
 
K
-
 
D
-
 
P
-
 
A
-
 
G
-
 
G
N
 
N
K
 
K
V
 
I
D
 
K
A
 
A
V
 
V
-
 
G
-
 
S
-
 
K
-
 
P
-
 
A
-
 
S
-
 
I
-
 
F
-
 
K
-
 
G
-
 
F
V
 
L
A
 
A
S
 
P
N
 
N
D
 
D
G
 
G
T
 
M
A
 
A
G
 
E
G
 
Q
A
 
A
I
 
I
A
 
T
A
 
K
L
 
L
D
 
K
A
 
L
Q
 
E
G
 
G
L
 
F
-
 
D
A
 
T
G
 
Q
S
 
K
V
 
I
P
 
F
V
 
V
S
 
T
G
 
G
Q
 
Q
D
|
D
A
 
Y
D
 
N
K
 
D
A
 
K
A
 
A
L
 
K
N
 
T
R
 
F
V
 
I
A
 
K
L
 
D
G
 
G
T
 
D
Q
 
Q
T
 
N
V
 
M
S
 
T
V
 
I
W
 
Y
K
|
K
D
 
P
S
 
D
R
 
K
E
 
V
L
 
L
G
 
G
K
 
K
K
 
V
A
 
A
A
 
V
E
 
E
I
 
V
A
 
L
V
 
R
A
 
V
L
 
L
A
 
I
G
 
A
G
 
K
K
 
K
-
 
N
-
 
K
-
 
A
T
 
S
M
 
R
D
 
S
E
 
E
V
 
V
E
 
E
G
 
N
V
 
E
-
 
L
-
 
K
-
 
A
-
 
K
-
 
L
-
 
P
-
 
N
-
 
I
-
 
S
-
 
F
-
 
K
-
 
Y
-
 
D
-
 
N
Q
 
Q
T
 
T
F
 
Y
N
 
K
G
 
-
G
 
-
P
 
V
K
 
Q
G
 
G
V
 
K
A
 
N
M
 
I
K
 
N
S
 
T
V
 
I
F
 
L
L
 
V
A
 
S
P
 
P
L
 
V
A
 
I
I
 
V
T
 
T
K
 
K
D
 
A
N
 
N
L
 
V
N
 
D

Sites not aligning to the query:

6ruxA P46, an immunodominant surface protein from mycoplasma hyopneumoniae (see paper)
28% identity, 68% coverage: 85:320/345 of query aligns to 70:370/373 of 6ruxA

query
sites
6ruxA
L
 
F
I
 
I
V
 
I
L
 
A
A
 
P
Q
 
E
D
 
N
S
 
G
D
 
S
A
 
G
I
 
V
G
 
G
P
 
T
A
 
A
I
 
V
E
 
N
K
 
T
A
 
I
A
 
A
A
 
D
E
 
K
G
 
G
I
 
I
P
 
P
V
 
I
V
 
V
G
 
A
Y
 
Y
D
 
D
R
 
R
L
 
L
I
 
I
E
 
T
N
 
G
P
 
S
D
 
D
A
 
K
F
 
Y
-
 
D
-
 
W
Y
 
Y
I
 
V
T
 
S
F
 
F
D
 
D
N
 
N
K
 
E
E
 
K
V
 
V
G
 
G
R
 
E
L
 
L
Q
 
Q
A
 
G
-
 
L
-
 
S
-
 
L
-
 
A
-
 
A
-
 
G
-
 
L
-
 
L
-
 
G
-
 
K
-
 
E
-
 
D
-
 
G
-
 
A
-
 
F
-
 
D
-
 
S
-
 
I
-
 
D
-
 
Q
-
 
M
R
 
N
E
 
E
V
 
Y
F
 
L
K
 
K
-
 
S
Q
 
H
K
 
M
P
 
P
E
 
Q
G
 
E
N
 
T
F
 
I
V
 
S
F
 
F
-
 
Y
-
 
T
I
 
I
K
 
A
G
 
G
S
 
S
S
 
Q
A
 
D
D
|
D
P
 
N
N
 
N
A
 
S
D
 
Q
F
 
Y
L
 
F
F
 
Y
S
 
N
G
 
G
Q
 
A
L
 
M
E
 
K
V
 
V
L
 
L
K
 
K
E
 
E
A
 
L
I
 
M
D
 
K
A
 
N
G
 
S
K
 
Q
I
 
N
K
 
K
N
 
I
V
 
I
-
 
D
-
 
L
-
 
S
-
 
P
-
 
E
G
 
G
E
 
E
-
 
N
-
 
A
A
 
V
Y
 
Y
T
 
V
D
 
P
G
 
G
W
|
W
K
 
N
P
 
Y
E
 
G
N
 
T
A
 
A
Q
 
G
K
 
Q
N
 
R
M
 
I
E
 
Q
Q
 
S
F
 
F
L
 
L
T
 
T
A
 
I
N
 
N
D
 
K
-
 
D
-
 
P
-
 
A
-
 
G
-
 
G
N
 
N
K
 
K
V
 
I
D
 
K
A
 
A
V
 
V
-
 
G
-
 
S
-
 
K
-
 
P
-
 
A
-
 
S
-
 
I
-
 
F
-
 
K
-
 
G
-
 
F
V
 
L
A
 
A
S
 
P
N
|
N
D
 
D
G
 
G
T
 
M
A
 
A
G
 
E
G
 
Q
A
 
A
I
 
I
A
 
T
A
 
K
L
 
L
D
 
K
A
 
L
Q
 
E
G
 
G
L
 
F
-
 
D
A
 
T
G
 
Q
S
 
K
V
 
I
P
 
F
V
 
V
S
 
T
G
 
G
Q
 
Q
D
|
D
A
 
Y
D
 
N
K
 
D
A
 
K
A
 
A
L
 
K
N
 
T
R
 
F
V
 
I
A
 
K
L
 
D
G
 
G
T
 
D
Q
 
Q
T
 
N
V
 
M
S
 
T
V
 
I
W
 
Y
K
 
K
D
 
P
S
 
D
R
 
K
E
 
V
L
 
L
G
 
G
K
 
K
K
 
V
A
 
A
A
 
V
E
 
E
I
 
V
A
 
L
V
 
R
A
 
V
L
 
L
A
 
I
G
 
A
G
 
K
K
 
K
-
 
N
-
 
K
-
 
A
T
 
S
M
 
R
D
 
S
E
 
E
V
 
V
E
 
E
G
 
N
V
 
E
-
 
L
-
 
K
-
 
A
-
 
K
-
 
L
-
 
P
-
 
N
-
 
I
-
 
S
-
 
F
-
 
K
-
 
Y
-
 
D
-
 
N
Q
 
Q
T
 
T
F
 
Y
N
 
K
G
 
-
G
 
-
P
 
V
K
 
Q
G
 
G
V
 
K
A
 
N
M
 
I
K
 
N
S
 
T
V
 
I
F
 
L
L
 
V
A
 
S
P
 
P
L
 
V
A
 
I
I
 
V
T
 
T
K
 
K
D
 
A
N
 
N
L
 
V
N
 
D

P23905 D-galactose/methyl-galactoside binding periplasmic protein MglB; D-galactose-binding periplasmic protein; GBP; D-galactose/D-glucose-binding protein; GGBP from Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) (see 2 papers)
30% identity, 81% coverage: 6:284/345 of query aligns to 4:299/332 of P23905

query
sites
P23905
K
 
K
L
 
V
M
 
L
A
 
T
G
 
L
A
 
S
A
 
A
I
 
V
I
 
M
A
 
A
S
 
S
M
 
L
H
 
L
-
 
F
-
 
G
S
 
A
A
 
H
A
 
A
I
 
H
A
 
A
K
 
A
D
 
D
L
 
T
V
 
R
I
 
I
G
 
G
V
 
V
S
 
T
W
 
I
S
 
Y
N
 
K
F
 
Y
Q
 
D
E
x
D
E
 
N
R
 
F
W
 
M
K
 
S
T
 
V
D
 
V
E
 
R
A
 
K
A
 
A
I
 
I
K
 
E
A
 
K
A
 
D
L
 
G
E
 
K
A
 
S
S
 
A
G
 
P
D
 
D
-
 
V
K
 
Q
Y
 
L
I
 
L
S
 
M
A
 
N
D
 
D
A
 
S
Q
 
Q
S
 
N
S
 
D
A
 
Q
A
 
S
K
 
K
Q
 
Q
L
 
N
T
 
D
D
 
Q
I
 
I
E
 
D
S
 
V
L
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
A
L
 
L
I
 
A
V
 
I
L
 
N
A
 
L
Q
 
V
D
 
D
S
 
P
D
 
A
A
 
A
I
 
A
G
 
G
P
 
T
A
 
V
I
 
I
E
 
E
K
 
K
A
 
A
A
 
R
A
 
G
E
 
Q
G
 
N
I
 
V
P
 
P
V
 
V
V
 
V
G
 
F
Y
 
F
D
x
N
R
 
K
-
 
E
-
 
P
-
 
S
-
 
R
-
 
K
-
 
A
L
 
L
I
 
D
E
 
S
N
 
Y
P
 
D
D
 
K
A
 
A
F
 
Y
Y
 
Y
I
 
V
T
 
G
F
 
T
D
 
D
N
 
S
K
 
K
E
 
E
V
 
S
G
 
G
R
 
V
L
 
I
Q
 
Q
A
 
G
R
 
D
E
 
L
V
 
I
F
 
A
K
 
K
-
 
H
-
 
W
Q
 
Q
K
 
A
P
 
N
E
 
Q
G
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
-
 
G
-
x
K
-
 
I
N
x
Q
F
 
Y
V
 
V
F
 
L
I
 
L
K
 
K
G
 
G
S
 
E
S
 
P
A
 
G
D
x
H
P
 
P
N
x
D
A
 
A
D
 
E
F
 
-
L
 
-
F
 
-
S
 
A
G
x
R
Q
 
T
L
 
T
E
 
Y
V
 
V
L
 
V
K
 
K
E
 
E
A
 
L
I
 
N
D
 
D
A
 
K
G
 
G
K
 
I
I
 
Q
K
 
T
N
 
E
V
 
Q
G
 
L
E
 
A
A
 
L
Y
 
D
T
 
T
D
 
A
G
 
M
W
 
W
K
 
D
P
 
T
E
 
A
N
 
Q
A
 
A
Q
 
K
K
 
D
N
 
K
M
 
M
E
 
D
Q
 
A
F
 
W
L
 
L
T
 
S
A
 
G
-
 
P
N
 
N
D
 
A
N
 
N
K
 
K
V
 
I
D
x
E
A
 
V
V
 
V
V
 
I
A
 
A
S
 
N
N
|
N
D
 
D
G
 
A
T
 
M
A
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
L
 
L
D
 
K
A
 
A
Q
 
H
G
 
N
L
 
-
A
 
K
G
 
S
S
 
S
V
 
I
P
 
P
V
 
V
S
 
F
G
 
G
Q
 
V
D
|
D
A
 
A
D
 
L
K
 
P
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
V
A
 
K
L
 
S
G
 
G
T
 
A
Q
 
M
T
 
A
V
 
G
S
 
T
V
 
V
W
 
L
K
x
N
D
 
D
S
 
A
R
 
N
E
 
N
L
 
Q
G
 
A
K
 
K
K
 
A
A
 
T
A
 
F
E
 
D
I
 
L
A
 
A
V
 
K
A
 
N
L
 
L
A
 
A
G
 
E
G
 
G
K
 
K

2gbpA Sugar and signal-transducer binding sites of the escherichia coli galactose chemoreceptor protein (see paper)
30% identity, 75% coverage: 25:284/345 of query aligns to 2:276/309 of 2gbpA

query
sites
2gbpA
D
 
D
L
 
T
V
 
R
I
 
I
G
 
G
V
 
V
S
 
T
W
 
I
S
 
Y
N
 
K
F
 
Y
Q
 
D
E
x
D
E
 
N
R
 
F
W
 
M
K
 
S
T
 
V
D
 
V
E
 
R
A
 
K
A
 
A
I
 
I
K
 
E
A
 
Q
A
 
D
L
 
A
E
 
K
A
 
A
S
 
A
G
 
P
D
 
D
-
 
V
K
 
Q
Y
 
L
I
 
L
S
 
M
A
 
N
D
 
D
A
 
S
Q
 
Q
S
 
N
S
 
D
A
 
Q
A
 
S
K
 
K
Q
 
Q
L
 
N
T
 
D
D
 
Q
I
 
I
E
 
D
S
 
V
L
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
A
L
 
L
I
 
A
V
 
I
L
 
N
A
 
L
Q
 
V
D
 
D
S
 
P
D
 
A
A
 
A
I
 
A
G
 
G
P
 
T
A
 
V
I
 
I
E
 
E
K
 
K
A
 
A
A
 
R
A
 
G
E
 
Q
G
 
N
I
 
V
P
 
P
V
 
V
V
 
V
G
 
F
Y
 
F
D
x
N
R
x
K
-
 
E
-
 
P
-
 
S
-
 
R
-
 
K
-
 
A
L
 
L
I
 
D
E
 
S
N
 
Y
P
 
D
D
 
K
A
 
A
F
 
Y
Y
 
Y
I
 
V
T
 
G
F
 
T
D
 
D
N
 
S
K
 
K
E
 
E
V
 
S
G
 
G
R
 
I
L
 
I
Q
 
Q
A
 
G
R
 
D
E
 
L
V
 
I
F
 
A
K
 
K
Q
 
H
-
 
W
-
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
K
x
N
P
 
K
E
x
D
G
 
G
-
x
Q
-
 
I
N
x
Q
F
 
F
V
 
V
F
 
L
I
 
L
K
 
K
G
 
G
S
 
E
S
 
P
A
 
G
D
x
H
P
 
P
N
x
D
A
 
A
D
 
E
F
 
-
L
 
-
F
 
-
S
 
A
G
x
R
Q
 
T
L
 
T
E
 
Y
V
 
V
L
 
I
K
 
K
E
 
E
A
 
L
I
 
N
D
 
D
A
 
K
G
 
G
K
 
I
I
 
K
K
 
T
N
 
E
V
 
Q
G
 
L
E
 
Q
A
 
L
Y
 
D
T
 
T
D
 
A
G
 
M
W
|
W
K
 
D
P
 
T
E
 
A
N
 
Q
A
 
A
Q
 
K
K
 
D
N
 
K
M
 
M
E
 
D
Q
 
A
F
 
W
L
 
L
T
 
S
A
 
G
-
 
P
N
 
N
D
 
A
N
 
N
K
 
K
V
 
I
D
x
E
A
 
V
V
 
V
V
 
I
A
 
A
S
 
N
N
|
N
D
 
D
G
 
A
T
 
M
A
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
L
 
L
D
 
K
A
 
A
Q
 
H
G
 
N
L
 
-
A
 
K
G
 
S
S
 
S
V
 
I
P
 
P
V
 
V
S
 
F
G
 
G
Q
 
V
D
|
D
A
 
A
D
 
L
K
 
P
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
V
A
 
K
L
 
S
G
 
G
T
 
A
Q
 
L
T
 
A
V
 
G
S
 
T
V
 
V
W
 
L
K
x
N
D
 
D
S
 
A
R
 
N
E
 
N
L
 
Q
G
 
A
K
 
K
K
 
A
A
 
T
A
 
F
E
 
D
I
 
L
A
 
A
V
 
K
A
 
N
L
 
L
A
 
A
G
 
D
G
 
G
K
 
K

2qw1A Glucose/galactose binding protein bound to 3-o-methyl d-glucose (see paper)
30% identity, 75% coverage: 25:284/345 of query aligns to 1:275/305 of 2qw1A

query
sites
2qw1A
D
 
D
L
 
T
V
 
R
I
 
I
G
 
G
V
 
V
S
 
T
W
 
I
S
 
Y
N
 
K
F
 
Y
Q
 
D
E
 
D
E
 
N
R
 
F
W
 
M
K
 
S
T
 
V
D
 
V
E
 
R
A
 
K
A
 
A
I
 
I
K
 
E
A
 
Q
A
 
D
L
 
A
E
 
K
A
 
A
S
 
A
G
 
P
D
 
D
-
 
V
K
 
Q
Y
 
L
I
 
L
S
 
M
A
 
N
D
 
D
A
 
S
Q
 
Q
S
 
N
S
 
D
A
 
Q
A
 
S
K
 
K
Q
 
Q
L
 
N
T
 
D
D
 
Q
I
 
I
E
 
D
S
 
V
L
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
A
L
 
L
I
 
A
V
 
I
L
 
N
A
 
L
Q
 
V
D
 
D
S
 
P
D
 
A
A
 
A
I
 
A
G
 
G
P
 
T
A
 
V
I
 
I
E
 
E
K
 
K
A
 
A
A
 
R
A
 
G
E
 
Q
G
 
N
I
 
V
P
 
P
V
 
V
V
 
V
G
 
F
Y
 
F
D
 
N
R
 
K
-
 
E
-
 
P
-
 
S
-
 
R
-
 
K
-
 
A
L
 
L
I
 
D
E
 
S
N
 
Y
P
 
D
D
 
K
A
 
A
F
 
Y
Y
 
Y
I
 
V
T
 
G
F
 
T
D
 
D
N
 
S
K
 
K
E
 
E
V
 
S
G
 
G
R
 
I
L
 
I
Q
 
Q
A
 
G
R
 
D
E
 
L
V
 
I
F
 
A
K
 
K
Q
 
H
-
 
W
-
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
K
x
N
P
 
K
E
x
D
G
 
G
-
x
Q
-
 
I
N
x
Q
F
 
F
V
 
V
F
 
L
I
 
L
K
 
K
G
 
G
S
 
E
S
 
P
A
 
G
D
x
H
P
 
P
N
 
D
A
 
A
D
 
E
F
 
-
L
 
-
F
 
-
S
 
A
G
 
R
Q
 
T
L
 
T
E
 
Y
V
 
V
L
 
I
K
 
K
E
 
E
A
 
L
I
 
N
D
 
D
A
 
K
G
 
G
K
 
I
I
 
K
K
 
T
N
 
E
V
 
Q
G
 
L
E
 
Q
A
 
L
Y
 
D
T
 
T
D
 
A
G
 
M
W
|
W
K
 
D
P
 
T
E
 
A
N
 
Q
A
 
A
Q
 
K
K
 
D
N
 
K
M
 
M
E
 
D
Q
 
A
F
 
W
L
 
L
T
 
S
A
 
G
-
 
P
N
 
N
D
 
A
N
 
N
K
 
K
V
 
I
D
x
E
A
 
V
V
 
V
V
 
I
A
 
A
S
 
N
N
|
N
D
 
D
G
 
A
T
 
M
A
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
L
 
L
D
 
K
A
 
A
Q
 
H
G
 
N
L
 
-
A
 
K
G
 
S
S
 
S
V
 
I
P
 
P
V
 
V
S
 
F
G
 
G
Q
 
V
D
|
D
A
 
A
D
 
L
K
 
P
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
V
A
 
K
L
 
S
G
 
G
T
 
A
Q
 
L
T
 
A
V
 
G
S
 
T
V
 
V
W
 
L
K
 
N
D
 
D
S
 
A
R
 
N
E
 
N
L
 
Q
G
 
A
K
 
K
K
 
A
A
 
T
A
 
F
E
 
D
I
 
L
A
 
A
V
 
K
A
 
N
L
 
L
A
 
A
G
 
D
G
 
G
K
 
K

5kwsA Crystal structure of galactose binding protein from yersinia pestis in the complex with beta d glucose
29% identity, 85% coverage: 28:319/345 of query aligns to 5:303/307 of 5kwsA

query
sites
5kwsA
I
 
I
G
 
G
V
 
V
S
 
T
W
 
I
S
 
Y
N
 
K
F
 
Y
Q
 
D
E
x
D
E
 
N
R
 
F
W
 
M
K
 
S
T
 
V
D
 
V
E
 
R
A
 
K
A
 
A
I
 
I
K
 
E
A
 
K
A
 
D
L
 
A
E
 
K
A
 
A
S
 
S
G
 
P
D
 
E
-
 
I
K
 
T
Y
 
L
I
 
L
S
 
M
A
 
N
D
 
D
A
 
S
Q
 
Q
S
 
N
S
 
D
A
 
Q
A
 
S
K
 
K
Q
 
Q
L
 
N
T
 
D
D
 
Q
I
 
I
E
 
D
S
 
V
L
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
A
L
 
L
I
 
A
V
 
I
L
 
N
A
 
L
Q
 
V
D
 
D
S
 
P
D
 
A
A
 
A
I
 
A
G
 
P
P
 
V
A
 
V
I
 
I
E
 
D
K
 
K
A
 
A
A
 
R
A
 
S
E
 
N
G
 
D
I
 
I
P
 
P
V
 
I
V
 
V
G
 
F
Y
 
Y
D
x
N
R
x
K
-
 
E
-
 
P
-
 
S
-
 
R
-
 
K
-
 
A
L
 
L
I
 
D
E
 
S
N
 
Y
P
 
D
D
 
K
A
 
A
F
 
Y
Y
 
Y
I
 
V
T
 
G
F
 
T
D
 
D
N
 
S
K
 
K
E
 
E
V
 
S
G
 
G
R
 
V
L
 
I
Q
 
Q
A
 
G
R
 
E
E
 
L
V
 
I
F
 
A
K
 
K
Q
 
H
-
 
W
-
 
Q
-
 
A
K
 
N
P
 
P
E
 
E
G
 
W
N
x
D
-
 
L
-
x
N
-
 
K
-
x
D
-
 
G
-
x
K
-
 
I
-
x
Q
F
 
F
V
 
V
F
 
L
I
 
L
K
 
K
G
 
G
S
 
E
S
 
P
A
 
G
D
x
H
P
 
P
N
x
D
A
 
A
D
 
E
F
 
A
L
x
R
F
 
T
S
 
T
G
 
Y
Q
 
V
L
 
I
E
 
K
V
 
T
L
 
L
K
 
N
E
 
E
A
 
-
I
 
-
D
 
-
A
 
K
G
 
G
K
 
L
I
 
P
K
 
T
N
 
Q
V
 
Q
G
 
L
E
 
Q
A
 
L
Y
 
D
T
 
T
D
 
A
G
 
M
W
|
W
K
 
D
P
 
T
E
 
A
N
 
Q
A
 
A
Q
 
K
K
 
D
N
 
K
M
 
M
E
 
D
Q
 
A
F
 
W
L
 
L
T
 
S
-
 
G
A
 
P
N
 
N
D
 
A
N
 
N
K
 
K
V
 
I
D
x
E
A
 
V
V
 
V
V
 
I
A
 
A
S
 
N
N
|
N
D
 
D
G
 
A
T
 
M
A
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
L
 
L
D
 
K
A
 
A
Q
 
H
G
 
N
L
 
-
A
 
K
G
 
T
S
 
S
V
 
V
P
 
P
V
 
V
S
 
F
G
 
G
Q
 
V
D
|
D
A
 
A
D
 
L
K
 
P
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
V
A
 
K
L
 
S
G
 
G
T
 
Q
Q
 
M
T
 
A
V
 
G
S
 
T
V
 
V
W
 
L
K
x
N
D
 
D
S
 
A
R
 
N
E
 
N
L
 
Q
G
 
A
K
 
K
K
 
A
A
 
T
A
 
F
E
 
D
I
 
L
A
 
A
V
 
K
A
 
N
L
 
L
A
 
A
G
 
A
G
 
G
K
 
K
T
 
P
M
 
A
D
 
A
E
 
E
V
 
-
E
 
-
G
 
-
V
 
-
Q
 
-
T
 
-
F
 
-
N
 
-
G
 
G
G
 
T
P
 
T
K
 
W
G
 
K
V
 
I
A
 
E
M
 
N
K
 
K
S
 
I
V
 
V
F
 
R
L
 
I
A
 
P
P
 
Y
L
 
V
A
 
G
I
 
V
T
 
D
K
 
K
D
 
D
N
 
N
L
 
L

1gcaA The 1.7 angstroms refined x-ray structure of the periplasmic glucose(slash)galactose receptor from salmonella typhimurium (see paper)
30% identity, 75% coverage: 25:284/345 of query aligns to 2:276/309 of 1gcaA

query
sites
1gcaA
D
 
D
L
 
T
V
 
R
I
 
I
G
 
G
V
 
V
S
 
T
W
 
I
S
 
Y
N
 
K
F
 
Y
Q
 
D
E
x
D
E
 
N
R
x
F
W
 
M
K
 
S
T
 
V
D
 
V
E
 
R
A
 
K
A
 
A
I
 
I
K
 
E
A
 
K
A
 
D
L
 
G
E
 
K
A
 
S
S
 
A
G
 
P
D
 
D
-
 
V
K
 
Q
Y
 
L
I
 
L
S
 
M
A
 
N
D
 
D
A
 
S
Q
 
Q
S
 
N
S
 
D
A
 
Q
A
 
S
K
 
K
Q
 
Q
L
 
N
T
 
D
D
 
Q
I
 
I
E
 
D
S
 
V
L
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
A
L
 
L
I
 
A
V
 
I
L
 
N
A
 
L
Q
 
V
D
 
D
S
 
P
D
 
A
A
 
A
I
 
A
G
 
G
P
 
T
A
 
V
I
 
I
E
 
E
K
 
K
A
 
A
A
 
R
A
 
G
E
 
Q
G
 
N
I
 
V
P
 
P
V
 
V
V
 
V
G
 
F
Y
 
F
D
x
N
R
x
K
-
 
E
-
 
P
-
 
S
-
 
R
-
 
K
-
 
A
L
 
L
I
 
D
E
 
S
N
 
Y
P
 
D
D
 
K
A
 
A
F
 
Y
Y
 
Y
I
 
V
T
 
G
F
 
T
D
 
D
N
 
S
K
 
K
E
 
E
V
 
S
G
 
G
R
 
V
L
 
I
Q
 
Q
A
 
G
R
 
D
E
 
L
V
 
I
F
 
A
K
 
K
-
 
H
-
 
W
Q
 
Q
K
 
A
P
 
N
E
 
Q
G
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
-
 
G
-
x
K
-
 
I
N
x
Q
F
 
Y
V
 
V
F
 
L
I
 
L
K
 
K
G
 
G
S
 
E
S
 
P
A
 
G
D
x
H
P
 
P
N
x
D
A
 
A
D
 
E
F
 
-
L
 
-
F
 
-
S
 
A
G
x
R
Q
 
T
L
 
T
E
 
Y
V
 
V
L
 
V
K
 
K
E
 
E
A
 
L
I
 
N
D
 
D
A
 
K
G
 
G
K
 
I
I
 
Q
K
 
T
N
 
E
V
 
Q
G
 
L
E
 
A
A
 
L
Y
 
D
T
 
T
D
 
A
G
 
M
W
 
W
K
 
D
P
 
T
E
 
A
N
 
Q
A
 
A
Q
 
K
K
 
D
N
 
K
M
 
M
E
 
D
Q
 
A
F
 
W
L
 
L
T
 
S
A
 
G
-
 
P
N
 
N
D
 
A
N
 
N
K
 
K
V
 
I
D
x
E
A
 
V
V
 
V
V
 
I
A
 
A
S
 
N
N
|
N
D
 
D
G
 
A
T
 
M
A
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
L
 
L
D
 
K
A
 
A
Q
 
H
G
 
N
L
 
-
A
 
K
G
 
S
S
 
S
V
 
I
P
 
P
V
 
V
S
 
F
G
 
G
Q
 
V
D
|
D
A
 
A
D
 
L
K
 
P
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
V
A
 
K
L
 
S
G
 
G
T
 
A
Q
 
M
T
 
A
V
 
G
S
 
T
V
 
V
W
 
L
K
x
N
D
 
D
S
 
A
R
 
N
E
 
N
L
 
Q
G
 
A
K
 
K
K
 
A
A
 
T
A
 
F
E
 
D
I
 
L
A
 
A
V
 
K
A
 
N
L
 
L
A
 
A
G
 
E
G
 
G
K
 
K

3ga5A X-ray structure of glucose/galactose receptor from salmonella typhimurium in complex with (2r)-glyceryl-beta-d-galactopyranoside (see paper)
30% identity, 70% coverage: 45:284/345 of query aligns to 16:274/305 of 3ga5A

query
sites
3ga5A
A
 
S
A
 
V
I
 
V
K
 
R
A
 
K
A
 
A
L
 
I
E
 
E
A
 
K
S
 
D
G
 
G
D
 
K
-
 
S
-
 
A
-
 
P
-
 
D
-
 
V
K
 
Q
Y
 
L
I
 
L
S
 
M
A
 
N
D
 
D
A
 
S
Q
 
Q
S
 
N
S
 
D
A
 
Q
A
 
S
K
 
K
Q
 
Q
L
 
N
T
 
D
D
 
Q
I
 
I
E
 
D
S
 
V
L
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
A
L
 
L
I
 
A
V
 
I
L
 
N
A
 
L
Q
 
V
D
 
D
S
 
P
D
 
A
A
 
A
I
 
A
G
 
G
P
 
T
A
 
V
I
 
I
E
 
E
K
 
K
A
 
A
A
 
R
A
 
G
E
 
Q
G
 
N
I
 
V
P
 
P
V
 
V
V
 
V
G
 
F
Y
 
F
D
x
N
R
x
K
-
 
E
-
 
P
-
 
S
-
 
R
-
 
K
-
 
A
L
 
L
I
 
D
E
 
S
N
 
Y
P
 
D
D
 
K
A
 
A
F
 
Y
Y
 
Y
I
 
V
T
 
G
F
x
T
D
 
D
N
 
S
K
 
K
E
 
E
V
 
S
G
 
G
R
 
V
L
 
I
Q
 
Q
A
 
G
R
 
D
E
 
L
V
 
I
F
 
A
K
 
K
-
 
H
-
 
W
Q
 
Q
K
 
A
P
 
N
E
 
Q
G
 
G
-
 
W
-
x
D
-
 
L
-
x
N
-
 
K
-
x
D
-
 
G
-
x
K
-
 
I
N
x
Q
F
 
Y
V
 
V
F
 
L
I
 
L
K
 
K
G
 
G
S
 
E
S
 
P
A
 
G
D
x
H
P
 
P
N
x
D
A
 
A
D
 
E
F
 
-
L
 
-
F
 
-
S
 
A
G
x
R
Q
 
T
L
 
T
E
 
Y
V
 
V
L
 
V
K
 
K
E
 
E
A
 
L
I
 
N
D
 
D
A
 
K
G
 
G
K
 
I
I
 
Q
K
 
T
N
 
E
V
 
Q
G
 
L
E
 
A
A
 
L
Y
 
D
T
 
T
D
 
A
G
 
M
W
|
W
K
 
D
P
 
T
E
 
A
N
 
Q
A
 
A
Q
 
K
K
 
D
N
 
K
M
 
M
E
 
D
Q
 
A
F
 
W
L
 
L
T
 
S
A
 
G
-
 
P
N
 
N
D
 
A
N
 
N
K
 
K
V
 
I
D
x
E
A
 
V
V
 
V
V
 
I
A
 
A
S
 
N
N
|
N
D
 
D
G
 
A
T
 
M
A
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
L
 
L
D
 
K
A
 
A
Q
 
H
G
 
N
L
 
-
A
 
K
G
 
S
S
 
S
V
 
I
P
 
P
V
 
V
S
 
F
G
 
G
Q
 
V
D
|
D
A
 
A
D
 
L
K
 
P
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
V
A
 
K
L
 
S
G
 
G
T
 
A
Q
 
M
T
 
A
V
 
G
S
 
T
V
 
V
W
 
L
K
x
N
D
 
D
S
 
A
R
 
N
E
 
N
L
x
Q
G
 
A
K
 
K
K
 
A
A
 
T
A
 
F
E
 
D
I
 
L
A
 
A
V
 
K
A
 
N
L
 
L
A
 
A
G
 
E
G
 
G
K
 
K

Sites not aligning to the query:

4yo7A Crystal structure of an abc transporter solute binding protein (ipr025997) from bacillus halodurans c-125 (bh2323, target efi- 511484) with bound myo-inositol
29% identity, 76% coverage: 27:288/345 of query aligns to 8:267/287 of 4yo7A

query
sites
4yo7A
V
 
V
I
 
I
G
 
G
V
 
V
S
 
S
W
 
I
S
 
S
N
 
N
F
 
L
Q
x
D
E
 
E
E
 
F
R
 
L
W
 
T
K
 
Y
T
 
M
D
 
Q
E
 
D
A
 
A
A
 
M
I
 
K
K
 
E
A
 
E
A
 
A
L
 
A
E
 
N
A
 
Y
S
 
P
G
 
D
D
 
F
K
 
E
Y
 
F
I
 
I
S
 
F
A
 
S
D
 
D
A
 
A
Q
 
Q
S
 
N
S
 
D
A
 
S
A
 
T
K
 
Q
Q
 
Q
L
 
M
T
 
A
D
 
Q
I
 
V
E
 
E
S
 
N
L
 
F
I
 
I
A
 
S
Q
 
R
G
 
N
A
 
V
N
 
D
A
 
A
L
 
I
I
 
I
V
 
V
L
 
N
A
 
P
Q
 
V
D
 
D
S
 
T
D
 
T
A
 
S
I
 
A
G
 
V
P
 
D
A
 
I
I
 
V
E
 
N
K
 
M
A
 
V
A
 
N
A
 
D
E
 
A
G
 
G
I
 
I
P
 
P
V
 
I
V
 
I
G
 
I
Y
 
A
D
x
N
R
|
R
L
 
T
I
 
F
E
 
D
N
 
G
P
 
V
D
 
D
-
 
Q
-
 
A
A
 
T
F
 
A
Y
 
F
I
 
V
T
 
G
F
 
S
D
 
E
N
 
S
K
 
I
E
 
Q
V
 
S
G
 
G
R
 
L
L
 
L
Q
 
Q
A
 
M
R
 
E
E
 
E
V
 
V
F
 
A
K
 
K
Q
 
L
-
 
L
K
 
N
P
 
N
E
 
E
G
 
G
N
 
N
F
 
I
V
 
A
F
 
I
I
 
M
K
 
D
G
 
G
S
 
E
S
 
L
A
 
G
D
 
H
P
 
E
N
 
A
A
 
Q
D
 
I
F
 
M
L
x
R
F
 
T
S
 
E
G
 
G
Q
 
N
L
 
K
E
 
Q
V
 
I
L
 
I
K
 
E
E
 
E
A
 
H
I
 
-
D
 
D
A
 
G
G
 
L
K
 
E
I
 
V
K
 
V
N
 
L
V
 
Q
G
 
G
E
 
T
A
 
A
Y
 
K
T
 
F
D
 
D
G
 
R
W
 
S
K
 
E
P
 
-
E
 
-
N
 
-
A
 
G
Q
 
M
K
 
R
N
 
L
M
 
M
E
 
E
Q
 
N
F
 
W
L
 
L
T
 
N
A
 
S
N
 
G
D
 
-
N
 
T
K
 
E
V
 
I
D
 
D
A
 
A
V
 
V
V
 
V
A
 
A
S
 
N
N
|
N
D
 
D
G
 
E
T
 
M
A
 
A
G
 
L
G
 
G
A
 
A
I
 
I
A
 
L
A
 
A
L
 
L
D
 
E
A
 
A
Q
 
V
G
 
G
L
 
K
A
x
L
G
 
D
S
 
D
V
|
V
P
 
I
V
 
V
S
 
A
G
 
G
Q
 
I
D
|
D
A
 
A
D
 
T
K
 
P
A
 
A
A
 
A
L
 
L
N
 
E
R
 
A
V
 
M
A
 
K
L
 
E
G
 
G
T
 
K
Q
 
L
T
 
D
V
 
V
S
 
T
V
 
V
W
 
F
K
x
Q
D
 
D
S
 
A
R
 
K
E
 
G
L
 
Q
G
 
G
K
 
A
K
 
T
A
 
S
A
 
V
E
 
K
I
 
V
A
 
A
V
 
V
A
 
Q
L
 
A
A
 
A
G
 
N
G
 
G
K
 
E
T
 
D
M
 
V
D
 
E
E
 
D

8fxtA Escherichia coli periplasmic glucose-binding protein glucose complex: acrylodan conjugate attached at w183c (see paper)
30% identity, 74% coverage: 28:284/345 of query aligns to 4:275/305 of 8fxtA

query
sites
8fxtA
I
 
I
G
 
G
V
 
V
S
 
T
W
 
I
S
x
Y
N
 
K
F
 
Y
Q
x
D
E
x
D
E
x
N
R
 
F
W
 
M
K
 
S
T
 
V
D
 
V
E
 
R
A
 
K
A
 
A
I
 
I
K
 
E
A
 
Q
A
 
D
L
 
A
E
 
K
A
 
A
S
 
A
G
 
P
D
 
D
-
 
V
K
 
Q
Y
 
L
I
 
L
S
 
M
A
 
N
D
|
D
A
 
S
Q
|
Q
S
x
N
S
 
D
A
 
Q
A
 
S
K
 
K
Q
 
Q
L
 
N
T
 
D
D
 
Q
I
 
I
E
 
D
S
 
V
L
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
N
 
K
A
 
A
L
 
L
I
 
A
V
 
I
L
 
N
A
 
L
Q
 
V
D
 
D
S
 
P
D
 
A
A
 
A
I
 
A
G
 
G
P
 
T
A
 
V
I
 
I
E
 
E
K
 
K
A
 
A
A
 
R
A
 
G
E
 
Q
G
 
N
I
 
V
P
 
P
V
 
V
V
 
V
G
 
F
Y
 
F
D
x
N
R
 
K
-
 
E
-
 
P
-
 
S
-
 
R
-
 
K
-
 
A
L
 
L
I
 
D
E
 
S
N
 
Y
P
 
D
D
 
K
A
 
A
F
 
Y
Y
 
Y
I
 
V
T
 
G
F
 
T
D
 
D
N
 
S
K
 
K
E
 
E
V
 
S
G
 
G
R
 
I
L
 
I
Q
 
Q
A
 
G
R
x
D
E
 
L
V
 
I
F
 
A
K
|
K
Q
 
H
-
 
W
-
 
A
-
 
A
-
 
N
-
 
Q
-
 
G
-
 
W
-
x
D
-
 
L
K
x
N
P
 
K
E
x
D
G
 
G
-
x
Q
-
 
I
N
x
Q
F
 
F
V
 
V
F
 
L
I
 
L
K
 
K
G
 
G
S
x
E
S
 
P
A
 
G
D
x
H
P
 
P
N
x
D
A
 
A
D
 
E
F
 
-
L
 
-
F
 
-
S
 
A
G
x
R
Q
 
T
L
 
T
E
 
Y
V
 
V
L
 
I
K
 
K
E
 
E
A
 
L
I
 
N
D
 
D
A
 
K
G
 
G
K
 
I
I
 
K
K
 
T
N
 
E
V
 
Q
G
 
L
E
 
Q
A
 
L
Y
 
D
T
 
T
D
 
A
G
x
M
W
x
C
K
x
D
P
x
T
E
 
A
N
 
Q
A
 
A
Q
x
K
K
x
D
N
 
K
M
 
M
E
 
D
Q
 
A
F
 
W
L
 
L
T
 
S
A
 
G
-
 
P
N
 
N
D
 
A
N
 
N
K
 
K
V
 
I
D
x
E
A
 
V
V
 
V
V
 
I
A
 
A
S
 
N
N
|
N
D
 
D
G
 
A
T
 
M
A
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
L
 
L
D
 
K
A
 
A
Q
 
H
G
 
N
L
 
-
A
 
K
G
 
S
S
 
S
V
 
I
P
 
P
V
 
V
S
 
F
G
 
G
Q
 
V
D
|
D
A
 
A
D
 
L
K
 
P
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
V
A
 
K
L
 
S
G
 
G
T
 
A
Q
 
L
T
 
A
V
 
G
S
 
T
V
 
V
W
 
L
K
x
N
D
 
D
S
 
A
R
 
N
E
 
N
L
 
Q
G
 
A
K
 
K
K
 
A
A
 
T
A
 
F
E
 
D
I
 
L
A
 
A
V
 
K
A
 
N
L
 
L
A
 
A
G
 
D
G
 
G
K
 
K

Sites not aligning to the query:

4ry9B Crystal structure of carbohydrate transporter solute binding protein veis_2079 from verminephrobacter eiseniae ef01-2, target efi-511009, a complex with d-talitol
26% identity, 85% coverage: 28:320/345 of query aligns to 5:288/297 of 4ry9B

query
sites
4ry9B
I
 
I
G
 
G
V
 
V
S
 
S
W
 
M
S
x
K
N
 
T
F
 
L
Q
 
S
E
 
A
E
 
P
R
x
Y
W
x
F
K
 
A
T
 
A
D
 
Q
E
 
M
A
 
E
A
 
A
I
 
A
K
 
K
A
 
A
A
 
R
L
 
G
E
 
K
A
 
E
S
 
L
G
 
G
D
 
Y
K
 
E
Y
 
V
I
 
L
S
 
A
A
 
T
D
 
D
A
 
A
Q
 
Q
S
 
G
S
 
K
A
 
L
A
 
Q
K
 
K
Q
 
Q
L
 
I
T
 
S
D
 
D
I
 
V
E
 
E
S
 
D
L
 
L
I
 
V
A
 
T
Q
 
R
G
 
G
A
 
V
N
 
K
A
 
L
L
 
L
I
 
I
V
 
I
L
 
N
A
 
P
Q
 
A
D
|
D
S
|
S
D
 
E
A
 
G
I
 
L
G
 
V
P
 
N
A
 
A
I
 
V
E
 
N
K
 
N
A
 
A
A
 
S
A
 
A
E
 
N
G
 
G
I
 
V
P
 
K
V
 
V
V
 
V
G
 
V
Y
 
I
D
|
D
R
x
S
L
x
T
I
 
L
E
 
-
N
 
N
P
 
P
D
 
R
A
 
A
F
 
N
Y
 
F
I
 
V
T
 
T
-
 
Q
-
 
V
-
 
Q
-
 
S
-
 
S
-
 
N
-
 
S
F
 
I
D
 
N
N
 
G
K
 
A
E
 
L
V
 
V
G
 
G
R
 
H
L
 
W
Q
 
V
A
 
I
R
 
E
E
 
E
V
 
V
F
 
G
K
 
N
Q
 
K
K
 
S
P
 
L
E
 
K
G
 
-
N
 
-
F
 
I
V
 
A
F
 
L
I
 
L
K
 
S
G
 
G
S
 
E
S
 
K
A
 
G
D
x
N
P
|
P
N
 
V
A
 
G
D
 
Q
-
 
E
-
x
R
-
 
R
-
 
L
F
 
G
L
 
V
F
 
L
S
 
S
G
 
G
Q
 
I
L
 
I
E
 
E
V
 
A
L
 
Q
K
 
L
E
 
R
A
 
K
I
 
F
D
 
G
A
 
K
G
 
A
K
 
D
I
 
L
K
 
T
N
 
V
V
 
V
G
 
G
E
 
Q
A
 
G
Y
 
W
T
 
G
D
 
H
G
 
-
W
|
W
K
 
N
P
 
D
E
 
E
N
 
G
A
 
G
Q
 
L
K
 
K
N
 
A
M
 
M
E
 
E
Q
 
D
F
 
L
L
 
L
T
 
V
A
 
A
N
 
N
D
 
K
N
 
D
K
 
-
V
 
I
D
 
N
A
 
M
V
 
V
V
 
L
A
 
G
S
 
E
N
|
N
D
 
D
G
 
S
T
 
M
A
 
V
G
 
L
G
 
G
A
 
A
I
 
R
A
 
R
A
 
A
L
 
I
D
 
E
A
 
S
Q
 
A
G
 
G
L
 
R
A
 
T
G
 
G
S
 
I
V
 
L
P
 
L
V
 
V
S
 
A
G
 
A
Q
 
A
D
|
D
A
 
A
D
 
Q
K
 
K
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
I
A
 
K
L
 
Q
G
 
G
T
 
K
Q
 
Y
T
 
G
V
 
V
S
 
T
V
 
G
W
 
L
K
 
N
D
 
D
S
 
P
R
 
A
E
 
L
L
 
V
G
 
A
K
 
R
K
 
T
A
 
A
A
 
I
E
 
D
I
 
L
A
 
G
V
 
V
A
 
K
L
 
V
A
 
V
G
 
K
G
 
G
K
 
E
T
 
V
M
 
K
D
 
D
E
 
-
V
 
-
E
 
-
G
 
-
V
 
-
Q
 
-
T
 
-
F
 
-
N
 
-
G
 
-
G
 
-
P
 
-
K
 
-
G
 
-
V
 
-
A
 
V
M
 
P
K
 
K
S
 
Q
V
 
T
F
 
L
L
 
T
A
 
T
P
 
P
L
 
A
A
 
A
I
 
I
T
 
T
K
 
K
D
 
G
N
 
N
L
 
V
N
 
D

4ry9A Crystal structure of carbohydrate transporter solute binding protein veis_2079 from verminephrobacter eiseniae ef01-2, target efi-511009, a complex with d-talitol
26% identity, 85% coverage: 28:320/345 of query aligns to 5:288/297 of 4ry9A

query
sites
4ry9A
I
 
I
G
 
G
V
 
V
S
 
S
W
 
M
S
x
K
N
 
T
F
 
L
Q
 
S
E
 
A
E
 
P
R
x
Y
W
x
F
K
 
A
T
 
A
D
 
Q
E
 
M
A
 
E
A
 
A
I
 
A
K
 
K
A
 
A
A
 
R
L
 
G
E
 
K
A
 
E
S
 
L
G
 
G
D
 
Y
K
 
E
Y
 
V
I
 
L
S
 
A
A
 
T
D
 
D
A
 
A
Q
 
Q
S
 
G
S
 
K
A
 
L
A
 
Q
K
 
K
Q
 
Q
L
 
I
T
 
S
D
 
D
I
 
V
E
 
E
S
 
D
L
 
L
I
 
V
A
 
T
Q
 
R
G
 
G
A
 
V
N
 
K
A
 
L
L
 
L
I
 
I
V
 
I
L
 
N
A
 
P
Q
 
A
D
 
D
S
 
S
D
 
E
A
 
G
I
 
L
G
 
V
P
 
N
A
 
A
I
 
V
E
 
N
K
 
N
A
 
A
A
 
S
A
 
A
E
 
N
G
 
G
I
 
V
P
 
K
V
 
V
V
 
V
G
 
V
Y
 
I
D
|
D
R
x
S
L
 
T
I
 
L
E
 
-
N
 
N
P
 
P
D
 
R
A
 
A
F
 
N
Y
 
F
I
 
V
T
 
T
-
 
Q
-
 
V
-
 
Q
-
 
S
-
 
S
-
 
N
-
 
S
F
 
I
D
 
N
N
 
G
K
 
A
E
 
L
V
 
V
G
 
G
R
 
H
L
 
W
Q
 
V
A
 
I
R
 
E
E
 
E
V
 
V
F
 
G
K
 
N
Q
 
K
K
 
S
P
 
L
E
 
K
G
 
-
N
 
-
F
 
I
V
 
A
F
 
L
I
 
L
K
 
S
G
 
G
S
 
E
S
 
K
A
 
G
D
x
N
P
 
P
N
 
V
A
 
G
D
 
Q
-
 
E
-
x
R
-
 
R
-
 
L
F
 
G
L
 
V
F
 
L
S
 
S
G
 
G
Q
 
I
L
 
I
E
 
E
V
 
A
L
 
Q
K
 
L
E
 
R
A
 
K
I
 
F
D
 
G
A
 
K
G
 
A
K
 
D
I
 
L
K
 
T
N
 
V
V
 
V
G
 
G
E
 
Q
A
 
G
Y
 
W
T
 
G
D
 
H
G
 
-
W
|
W
K
 
N
P
 
D
E
 
E
N
 
G
A
 
G
Q
 
L
K
 
K
N
 
A
M
 
M
E
 
E
Q
 
D
F
 
L
L
 
L
T
 
V
A
 
A
N
 
N
D
 
K
N
 
D
K
 
-
V
 
I
D
 
N
A
 
M
V
 
V
V
 
L
A
 
G
S
 
E
N
|
N
D
 
D
G
 
S
T
 
M
A
 
V
G
 
L
G
 
G
A
 
A
I
 
R
A
 
R
A
 
A
L
 
I
D
 
E
A
 
S
Q
 
A
G
 
G
L
 
R
A
 
T
G
 
G
S
 
I
V
 
L
P
 
L
V
 
V
S
 
A
G
 
A
Q
 
A
D
|
D
A
 
A
D
 
Q
K
 
K
A
 
E
A
 
A
L
 
L
N
 
A
R
 
L
V
 
I
A
 
K
L
 
Q
G
 
G
T
 
K
Q
 
Y
T
 
G
V
 
V
S
 
T
V
 
G
W
 
L
K
 
N
D
 
D
S
 
P
R
 
A
E
 
L
L
 
V
G
 
A
K
 
R
K
 
T
A
 
A
A
 
I
E
 
D
I
 
L
A
 
G
V
 
V
A
 
K
L
 
V
A
 
V
G
 
K
G
 
G
K
 
E
T
 
V
M
 
K
D
 
D
E
 
-
V
 
-
E
 
-
G
 
-
V
 
-
Q
 
-
T
 
-
F
 
-
N
 
-
G
 
-
G
 
-
P
 
-
K
 
-
G
 
-
V
 
-
A
 
V
M
 
P
K
 
K
S
 
Q
V
 
T
F
 
L
L
 
T
A
 
T
P
 
P
L
 
A
A
 
A
I
 
I
T
 
T
K
 
K
D
 
G
N
 
N
L
 
V
N
 
D

Query Sequence

>SM_b20902 FitnessBrowser__Smeli:SM_b20902
MKSILKLMAGAAIIASMHSAAIAKDLVIGVSWSNFQEERWKTDEAAIKAALEASGDKYIS
ADAQSSAAKQLTDIESLIAQGANALIVLAQDSDAIGPAIEKAAAEGIPVVGYDRLIENPD
AFYITFDNKEVGRLQAREVFKQKPEGNFVFIKGSSADPNADFLFSGQLEVLKEAIDAGKI
KNVGEAYTDGWKPENAQKNMEQFLTANDNKVDAVVASNDGTAGGAIAALDAQGLAGSVPV
SGQDADKAALNRVALGTQTVSVWKDSRELGKKAAEIAVALAGGKTMDEVEGVQTFNGGPK
GVAMKSVFLAPLAITKDNLNVVIDAGWISKEEACQGAKSDVAACK

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory