SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_069330983.1 NCBI__GCF_003046325.1:WP_069330983.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

3ma0A Closed liganded crystal structure of xylose binding protein from escherichia coli (see paper)
33% identity, 78% coverage: 62:334/349 of query aligns to 33:307/313 of 3ma0A

query
sites
3ma0A
C
 
A
T
 
K
V
 
V
I
 
F
Y
 
V
Q
 
Q
N
 
S
A
 
A
N
 
N
G
 
G
D
 
N
V
 
E
A
 
E
L
 
T
Q
 
Q
Q
 
M
Q
 
S
Q
 
Q
F
 
I
N
 
E
S
 
N
V
 
M
I
 
I
A
 
N
Q
 
R
G
 
G
A
 
V
K
 
D
I
 
V
V
 
L
V
 
V
L
 
I
D
 
I
P
 
P
V
 
Y
D
 
N
S
 
G
A
 
Q
A
 
V
A
 
L
A
 
S
S
 
N
M
 
V
V
 
V
E
 
K
I
 
E
A
 
A
H
 
K
S
 
Q
Q
 
E
D
 
G
V
 
I
K
 
K
V
 
V
I
 
L
A
 
A
Y
 
Y
D
|
D
R
|
R
P
 
M
I
 
I
P
 
N
A
 
D
T
 
A
P
 
D
A
 
I
D
 
D
Y
 
F
Y
 
Y
V
 
I
S
 
S
F
 
F
D
 
D
N
 
N
K
 
E
G
 
K
I
 
V
G
 
G
Q
 
E
A
 
L
I
 
Q
A
 
A
Q
 
K
S
 
A
L
 
L
V
 
V
D
 
D
H
 
I
L
 
-
K
 
-
A
 
-
T
 
-
G
 
-
V
 
V
P
 
P
D
 
Q
G
 
G
A
 
N
G
 
Y
V
 
F
L
 
L
Q
 
-
I
 
M
N
 
G
G
 
G
S
 
S
P
 
P
T
 
V
D
|
D
A
 
N
A
x
N
A
 
A
G
 
K
L
 
L
I
 
F
R
 
R
D
 
A
G
 
G
-
 
Q
-
 
M
-
 
K
-
 
V
I
 
L
D
 
K
A
 
P
A
 
Y
L
 
V
D
 
D
A
 
S
S
 
G
G
 
K
Y
 
I
K
 
K
T
 
V
L
 
V
A
 
G
E
 
D
F
 
Q
D
 
W
T
 
V
P
 
D
D
 
G
W
|
W
A
 
L
P
 
P
P
 
E
K
 
N
A
 
A
Q
 
L
E
 
K
W
 
I
A
 
M
A
 
E
G
 
N
Q
 
A
I
 
L
T
 
T
R
 
A
F
 
N
G
 
N
D
 
N
E
 
K
I
 
I
K
 
D
G
 
A
V
 
V
V
 
V
A
 
A
A
 
S
N
|
N
D
 
D
G
 
A
T
 
T
G
 
A
G
 
G
G
 
G
A
 
A
I
 
I
A
 
Q
A
 
A
F
 
L
K
 
S
A
 
A
A
 
Q
G
 
G
V
 
L
D
 
S
P
 
G
V
 
K
P
 
V
P
 
A
V
 
I
T
 
S
G
 
G
N
 
Q
D
|
D
A
 
A
T
 
D
I
 
L
A
 
A
A
 
G
L
 
I
Q
 
K
L
 
R
I
 
I
I
 
A
S
 
A
G
 
G
D
 
T
Q
 
Q
Y
 
T
N
 
M
T
 
T
I
 
V
S
 
Y
K
|
K
P
 
P
S
 
I
E
 
T
I
 
L
V
 
L
A
 
A
E
 
N
A
 
T
A
 
A
A
 
A
K
 
E
V
 
I
A
 
A
V
 
V
T
 
E
F
 
L
L
 
G
K
 
N
G
 
G
E
 
Q
T
 
E
P
 
P
E
 
K
A
 
A
K
 
D
T
 
T
T
 
T
-
 
L
-
 
N
-
 
N
-
 
G
L
 
L
Y
 
K
D
 
D
T
 
V
P
 
P
A
 
S
E
 
R
L
 
L
F
 
L
V
 
T
P
 
P
A
 
I
V
 
D
V
 
V
T
 
N
A
 
K
E
 
N
N
 
N
I
 
I
K
 
K
A
 
D
E
 
T
I
 
V
F
 
I
D
 
K
K
 
D
G
 
G
I
 
F
Q
 
H
T
 
K
A
 
E
A
 
S
E
 
E
V
 
L

Sites not aligning to the query:

4ywhA Crystal structure of an abc transporter solute binding protein (ipr025997) from actinobacillus succinogenes 130z (asuc_0499, target efi-511068) with bound d-xylose
31% identity, 87% coverage: 30:334/349 of query aligns to 5:308/310 of 4ywhA

query
sites
4ywhA
T
 
T
V
 
I
A
 
G
F
 
M
L
 
S
M
 
I
P
 
D
D
 
D
Q
 
L
A
 
R
S
x
L
T
 
E
R
|
R
Y
 
W
E
 
Q
E
 
K
H
 
-
D
 
D
F
 
R
P
 
D
G
 
I
F
 
F
Q
 
V
K
 
K
S
 
K
M
 
A
G
 
E
E
 
S
L
 
L
C
 
G
P
 
-
D
 
-
C
 
A
T
 
K
V
 
V
I
 
L
Y
 
V
Q
 
Q
N
 
S
A
 
A
N
 
N
G
 
G
D
 
D
V
 
D
A
 
S
L
 
A
Q
 
Q
Q
 
I
Q
 
S
Q
 
Q
F
 
I
N
 
E
S
 
N
V
 
M
I
 
L
A
 
N
Q
 
K
G
 
N
A
 
V
K
 
D
I
 
V
V
 
L
V
 
V
L
 
I
D
 
I
P
 
P
V
 
H
D
 
N
S
 
G
A
 
D
A
 
V
A
 
L
A
 
S
S
 
N
M
 
V
V
 
I
E
 
S
I
 
E
A
 
A
H
 
K
S
 
K
Q
 
E
D
 
G
V
 
V
K
 
K
V
 
V
I
 
L
A
 
A
Y
 
Y
D
|
D
R
|
R
P
 
L
I
 
I
P
 
N
A
 
N
T
 
A
P
 
D
A
 
L
D
 
D
Y
 
F
Y
 
Y
V
 
V
S
 
S
F
 
F
D
 
D
N
 
N
K
 
E
G
 
K
I
 
V
G
 
G
Q
 
E
A
 
L
I
 
Q
A
 
A
Q
 
D
S
 
A
L
 
I
V
 
I
D
 
K
H
 
E
L
 
-
K
 
-
A
 
-
T
 
-
G
 
-
V
 
K
P
 
P
D
 
E
G
 
G
A
 
N
G
 
Y
V
 
F
L
 
L
Q
 
-
I
 
M
N
 
G
G
 
G
S
 
S
P
 
P
T
 
V
D
|
D
A
 
N
A
x
N
A
 
A
G
 
K
L
 
L
I
 
F
R
 
R
D
 
K
G
 
G
-
 
Q
-
 
M
-
 
K
-
 
V
I
 
L
D
 
Q
A
 
P
A
 
L
L
 
I
D
 
D
A
 
S
S
 
G
G
 
K
Y
 
I
K
 
K
T
 
V
L
 
V
A
 
G
E
 
D
F
 
Q
D
 
W
T
 
V
P
 
D
D
 
S
W
|
W
A
 
L
P
 
A
P
 
E
K
 
K
A
 
A
Q
 
L
E
 
Q
W
 
I
A
 
M
A
 
E
G
 
N
Q
 
A
I
 
L
T
 
T
R
 
A
F
 
N
G
 
K
D
 
N
E
 
N
I
 
I
K
 
D
G
 
A
V
 
V
V
 
V
A
 
A
A
 
S
N
|
N
D
 
D
G
 
A
T
 
T
G
 
A
G
 
G
G
 
G
A
 
A
I
 
I
A
 
Q
A
 
A
F
 
L
K
 
S
A
 
A
A
 
Q
G
 
G
V
 
L
D
 
S
P
 
G
V
 
K
P
 
V
P
 
A
V
 
I
T
 
S
G
 
G
N
 
Q
D
|
D
A
 
A
T
 
D
I
 
L
A
 
A
A
 
A
L
 
I
Q
 
K
L
 
R
I
 
I
I
 
V
S
 
E
G
 
G
D
 
T
Q
 
Q
Y
 
T
N
 
M
T
 
T
I
 
V
S
 
Y
K
|
K
P
 
P
S
 
I
E
 
T
I
 
N
V
 
L
A
 
A
E
 
D
A
 
K
A
 
A
A
 
A
K
 
E
V
 
L
A
 
S
V
 
V
T
 
A
F
 
L
L
 
G
K
 
K
G
 
E
E
 
E
T
 
K
-
 
L
-
 
E
P
 
P
E
 
N
A
 
A
K
 
K
T
 
L
T
 
N
-
 
N
-
 
G
L
 
L
Y
 
K
D
 
E
T
 
V
P
 
D
A
 
A
E
 
Y
L
 
L
F
 
L
V
 
D
P
 
P
A
 
I
V
 
V
V
 
V
T
 
T
A
 
K
E
 
D
N
 
N
I
 
I
K
 
D
A
 
S
E
 
T
I
 
V
F
 
I
D
 
K
K
 
D
G
 
G
I
 
F
Q
 
H
T
 
S
A
 
K
A
 
E
E
 
A
V
 
V

4wwhA Crystal structure of an abc transporter solute binding protein (ipr025997) from mycobacterium smegmatis (msmeg_1704, target efi- 510967) with bound d-galactose
31% identity, 87% coverage: 30:334/349 of query aligns to 4:328/329 of 4wwhA

query
sites
4wwhA
T
 
T
V
 
V
A
 
G
F
 
I
L
 
A
M
 
M
P
 
P
D
 
T
Q
 
K
A
 
S
S
 
S
T
 
E
R
|
R
Y
 
W
E
 
V
E
 
A
H
 
-
D
 
D
F
 
G
P
 
Q
G
 
N
F
 
M
Q
 
V
K
 
D
S
 
Q
M
 
F
G
 
K
E
 
A
L
 
F
C
 
G
P
 
Y
D
 
D
C
 
T
T
 
D
V
 
L
I
 
Q
Y
 
Y
Q
 
-
N
 
-
A
 
-
N
 
-
G
 
G
D
 
D
V
 
D
A
 
V
L
 
V
Q
 
Q
Q
 
N
Q
 
Q
-
 
V
-
 
S
Q
 
Q
F
 
I
N
 
E
S
 
N
V
 
M
I
 
I
A
 
T
Q
 
K
G
 
G
A
 
V
K
 
K
I
 
L
V
 
L
V
 
V
L
 
I
D
 
A
P
 
P
V
 
I
D
 
D
S
 
G
A
 
S
A
 
S
A
 
L
A
 
T
S
 
N
M
 
T
V
 
L
E
 
Q
I
 
H
A
 
A
H
 
A
S
 
D
Q
 
L
D
 
K
V
 
I
K
 
P
V
 
V
I
 
I
A
 
S
Y
 
Y
D
|
D
R
|
R
P
 
L
I
 
I
P
 
K
A
 
G
T
 
T
P
 
P
-
 
N
A
 
V
D
 
D
Y
 
Y
Y
 
Y
V
 
A
S
 
T
F
 
F
D
 
D
N
 
N
K
 
T
G
 
K
I
 
V
G
 
G
Q
 
V
A
 
L
I
 
Q
A
 
A
Q
 
N
S
 
Y
L
 
I
V
 
V
D
 
D
H
 
T
L
 
L
K
 
-
A
 
-
T
 
-
G
 
G
V
 
V
P
 
A
D
 
D
G
 
G
A
 
K
G
 
G
V
 
P
L
 
F
Q
 
N
I
 
L
N
 
E
-
 
L
-
 
F
-
 
A
G
 
G
S
 
S
P
 
P
T
 
D
D
|
D
A
 
N
A
x
N
A
 
A
G
 
T
L
 
Y
I
 
F
R
 
F
D
 
Q
G
 
G
I
 
A
D
 
M
A
 
S
A
 
V
L
 
L
D
 
Q
-
 
P
-
 
Y
-
 
I
-
 
D
-
 
S
-
 
G
-
 
K
-
 
L
-
 
V
-
 
V
A
 
K
S
 
S
G
 
G
Y
 
Q
K
 
T
T
 
T
L
 
F
A
 
D
E
 
Q
F
 
I
D
 
A
T
 
T
P
 
L
D
 
R
W
|
W
A
 
D
P
 
G
P
 
G
K
 
L
A
 
A
Q
 
Q
E
 
S
W
 
R
A
 
M
A
 
D
G
 
N
Q
 
L
I
 
L
T
 
S
R
 
Q
-
 
A
-
 
Y
F
 
T
G
 
S
D
 
G
E
 
R
I
 
V
K
 
D
G
 
A
V
 
V
V
 
L
A
 
S
A
 
P
N
 
Y
D
 
D
G
 
G
T
 
I
G
 
S
G
 
R
G
 
G
A
 
V
I
 
I
A
 
S
A
 
A
F
 
L
K
 
K
A
 
S
A
 
A
G
 
G
V
 
Y
-
 
G
-
 
N
-
 
A
-
 
A
D
 
K
P
 
P
V
 
L
P
 
P
P
 
I
V
 
V
T
 
T
G
 
G
N
 
Q
D
|
D
A
 
A
T
 
E
I
 
L
A
 
A
A
 
S
L
 
V
Q
 
K
L
 
S
I
 
I
I
 
V
S
 
A
G
 
G
D
 
E
Q
 
Q
Y
 
T
N
 
Q
T
 
T
I
 
V
S
 
F
K
|
K
P
 
D
S
 
T
E
 
R
I
 
E
V
 
L
A
 
A
E
 
K
A
 
A
A
 
A
A
 
V
K
 
Q
V
 
E
A
 
A
V
 
D
T
 
A
F
 
V
L
 
L
K
 
T
G
 
G
E
 
G
T
 
T
P
 
P
E
 
Q
A
 
V
K
 
N
-
 
D
T
 
T
T
 
E
L
 
T
Y
 
Y
D
 
D
T
 
N
-
 
G
-
 
V
-
 
K
-
 
V
-
 
V
P
 
P
A
 
S
E
 
Y
L
 
L
F
 
L
V
 
D
P
 
P
A
 
V
V
 
S
V
 
V
T
 
D
A
 
K
E
 
S
N
 
N
I
 
Y
K
 
K
A
 
K
E
 
V
I
 
L
F
 
I
D
 
D
K
 
S
G
 
G
I
 
Y
Q
 
Y
T
 
T
A
 
E
A
 
T
E
 
Q
V
 
V

3uugA Crystal structure of the periplasmic sugar binding protein chve (see paper)
29% identity, 86% coverage: 27:327/349 of query aligns to 1:321/329 of 3uugA

query
sites
3uugA
E
 
D
A
 
K
A
 
G
T
 
S
V
 
V
A
 
G
F
 
I
L
 
A
M
 
M
P
 
P
D
 
T
Q
 
K
A
 
S
S
 
S
T
 
A
R
|
R
Y
 
W
E
 
I
E
 
D
H
 
-
D
 
D
F
 
G
P
 
N
G
 
N
F
 
I
Q
 
V
K
 
K
S
 
Q
M
 
L
G
 
Q
E
 
E
L
 
A
C
 
G
P
 
Y
D
 
K
C
 
T
T
 
D
V
 
L
I
 
Q
Y
 
Y
Q
 
-
N
 
-
A
 
A
N
 
D
G
 
D
D
 
D
V
 
I
A
 
P
L
 
N
Q
 
Q
Q
 
L
Q
 
S
Q
 
Q
F
 
I
N
 
E
S
 
N
V
 
M
I
 
V
A
 
T
Q
 
K
G
 
G
A
 
V
K
 
K
I
 
V
V
 
L
V
 
V
L
 
I
D
 
A
P
 
S
V
 
I
D
 
D
S
 
G
A
 
T
A
 
T
A
 
L
A
 
S
S
 
D
M
 
V
V
 
L
E
 
K
I
 
Q
A
 
A
H
 
G
S
 
E
Q
 
Q
D
 
G
V
 
I
K
 
K
V
 
V
I
 
I
A
 
A
Y
 
Y
D
|
D
R
|
R
P
 
L
I
 
I
P
 
R
A
 
N
T
 
S
-
 
G
P
 
D
A
 
V
D
 
S
Y
 
Y
Y
 
Y
V
 
A
S
 
T
F
 
F
D
 
D
N
 
N
K
 
F
G
 
Q
I
 
V
G
 
G
Q
 
V
A
 
L
I
 
Q
A
 
A
Q
 
T
S
 
S
L
 
I
V
 
T
D
 
D
H
 
K
L
 
L
K
 
-
A
 
-
T
 
-
G
 
G
V
 
L
P
 
K
D
 
D
G
 
G
A
 
K
G
 
G
V
 
P
L
 
F
Q
 
N
I
 
I
N
 
E
-
 
L
-
 
F
-
 
G
G
 
G
S
 
S
P
 
P
T
 
D
D
|
D
A
 
N
A
x
N
A
 
A
G
 
F
L
 
F
I
 
F
R
 
Y
D
 
D
G
 
G
I
 
A
D
 
M
A
 
S
A
 
V
L
 
L
D
 
K
-
 
P
-
 
Y
-
 
I
-
 
D
-
 
S
-
 
G
-
 
K
-
 
L
-
 
V
-
 
V
A
 
K
S
 
S
G
 
G
Y
 
Q
K
 
M
T
 
G
L
 
M
A
 
D
E
 
K
F
 
V
D
 
G
T
 
T
P
 
L
D
 
R
W
|
W
A
 
D
P
 
P
P
 
A
K
 
T
A
 
A
Q
 
Q
E
 
A
W
 
R
A
 
M
A
 
D
G
 
N
Q
 
L
I
 
L
T
 
S
R
 
A
F
 
Y
G
 
Y
D
 
T
E
 
D
I
 
A
K
 
K
-
 
V
-
 
D
G
 
A
V
 
V
V
 
L
A
 
S
A
 
P
N
x
Y
D
 
D
G
 
G
T
 
L
G
 
S
G
 
I
G
 
G
A
 
I
I
 
I
A
 
S
A
 
S
F
 
L
K
 
K
A
 
G
A
 
V
G
 
G
V
 
Y
-
 
G
-
 
T
-
 
K
-
 
D
D
 
Q
P
 
P
V
 
L
P
 
P
P
 
V
V
 
V
T
 
S
G
 
G
N
 
Q
D
|
D
A
 
A
T
 
E
I
 
V
A
 
P
A
 
S
L
 
V
Q
 
K
L
 
S
I
 
I
I
 
I
S
 
A
G
 
G
D
 
E
Q
 
Q
Y
 
Y
N
 
S
T
 
T
I
 
I
S
 
F
K
|
K
P
 
D
S
 
T
E
 
R
I
 
E
V
 
L
A
 
A
E
 
K
A
 
V
A
 
T
A
 
V
K
 
N
V
 
M
A
 
V
V
 
N
T
 
A
F
 
V
L
 
M
K
 
E
G
 
G
E
 
K
T
 
E
P
 
P
E
 
E
A
 
V
K
 
N
-
 
D
T
 
T
T
 
K
L
 
T
Y
 
Y
D
 
E
T
 
N
-
 
G
-
 
V
-
 
K
-
 
V
-
 
V
P
 
P
A
 
S
E
 
Y
L
 
L
F
 
L
V
 
K
P
 
P
A
 
V
V
 
A
V
 
V
T
 
T
A
 
K
E
 
E
N
 
N
I
 
Y
K
 
K
A
 
Q
E
 
V
I
 
L
F
 
V
D
 
D
K
 
G
G
 
G

3urmA Crystal structure of the periplasmic sugar binding protein chve (see paper)
29% identity, 86% coverage: 27:327/349 of query aligns to 1:321/329 of 3urmA

query
sites
3urmA
E
 
D
A
 
K
A
 
G
T
 
S
V
 
V
A
 
G
F
 
I
L
 
A
M
 
M
P
 
P
D
 
T
Q
 
K
A
 
S
S
 
S
T
 
A
R
|
R
Y
 
W
E
 
I
E
 
D
H
 
-
D
 
D
F
 
G
P
 
N
G
 
N
F
 
I
Q
 
V
K
 
K
S
 
Q
M
 
L
G
 
Q
E
 
E
L
 
A
C
 
G
P
 
Y
D
 
K
C
 
T
T
 
D
V
 
L
I
 
Q
Y
 
Y
Q
 
-
N
 
-
A
 
A
N
 
D
G
 
D
D
 
D
V
 
I
A
 
P
L
 
N
Q
 
Q
Q
 
L
Q
 
S
Q
 
Q
F
 
I
N
 
E
S
 
N
V
 
M
I
 
V
A
 
T
Q
 
K
G
 
G
A
 
V
K
 
K
I
 
V
V
 
L
V
 
V
L
 
I
D
 
A
P
 
S
V
 
I
D
 
D
S
 
G
A
 
T
A
 
T
A
 
L
A
 
S
S
 
D
M
 
V
V
 
L
E
 
K
I
 
Q
A
 
A
H
 
G
S
 
E
Q
 
Q
D
 
G
V
 
I
K
 
K
V
 
V
I
 
I
A
 
A
Y
 
Y
D
|
D
R
|
R
P
 
L
I
 
I
P
 
R
A
 
N
T
 
S
-
 
G
P
 
D
A
 
V
D
 
S
Y
 
Y
Y
 
Y
V
 
A
S
 
T
F
 
F
D
 
D
N
 
N
K
 
F
G
 
Q
I
 
V
G
 
G
Q
 
V
A
 
L
I
 
Q
A
 
A
Q
 
T
S
 
S
L
 
I
V
 
T
D
 
D
H
 
K
L
 
L
K
 
-
A
 
-
T
 
-
G
 
G
V
 
L
P
 
K
D
 
D
G
 
G
A
 
K
G
 
G
V
 
P
L
 
F
Q
 
N
I
 
I
N
 
E
-
 
L
-
 
F
-
 
G
G
 
G
S
 
S
P
 
P
T
 
D
D
|
D
A
 
N
A
x
N
A
 
A
G
 
F
L
 
F
I
 
F
R
 
Y
D
 
D
G
 
G
I
 
A
D
 
M
A
 
S
A
 
V
L
 
L
D
 
K
-
 
P
-
 
Y
-
 
I
-
 
D
-
 
S
-
 
G
-
 
K
-
 
L
-
 
V
-
 
V
A
 
K
S
 
S
G
 
G
Y
 
Q
K
 
M
T
 
G
L
 
M
A
 
D
E
 
K
F
 
V
D
 
G
T
 
T
P
 
L
D
 
R
W
|
W
A
 
D
P
 
P
P
 
A
K
 
T
A
 
A
Q
 
Q
E
 
A
W
 
R
A
 
M
A
 
D
G
 
N
Q
 
L
I
 
L
T
 
S
R
 
A
F
 
Y
G
 
Y
D
 
T
E
 
D
I
 
A
K
 
K
-
 
V
-
 
D
G
 
A
V
 
V
V
 
L
A
 
S
A
 
P
N
 
Y
D
 
D
G
 
G
T
 
L
G
 
S
G
 
I
G
 
G
A
 
I
I
 
I
A
 
S
A
 
S
F
 
L
K
 
K
A
 
G
A
 
V
G
 
G
V
 
Y
-
 
G
-
 
T
-
 
K
-
 
D
D
 
Q
P
 
P
V
 
L
P
 
P
P
 
V
V
 
V
T
 
S
G
 
G
N
 
Q
D
|
D
A
 
A
T
 
E
I
 
V
A
 
P
A
 
S
L
 
V
Q
 
K
L
 
S
I
 
I
I
 
I
S
 
A
G
 
G
D
 
E
Q
 
Q
Y
 
Y
N
 
S
T
 
T
I
 
I
S
 
F
K
|
K
P
 
D
S
 
T
E
 
R
I
 
E
V
 
L
A
 
A
E
 
K
A
 
V
A
 
T
A
 
V
K
 
N
V
 
M
A
 
V
V
 
N
T
 
A
F
 
V
L
 
M
K
 
E
G
 
G
E
 
K
T
 
E
P
 
P
E
 
E
A
 
V
K
 
N
-
 
D
T
 
T
T
 
K
L
 
T
Y
 
Y
D
 
E
T
 
N
-
 
G
-
 
V
-
 
K
-
 
V
-
 
V
P
 
P
A
 
S
E
 
Y
L
 
L
F
 
L
V
 
K
P
 
P
A
 
V
V
 
A
V
 
V
T
 
T
A
 
K
E
 
E
N
 
N
I
 
Y
K
 
K
A
 
Q
E
 
V
I
 
L
F
 
V
D
 
D
K
 
G
G
 
G

4rxuA Crystal structure of carbohydrate transporter solute binding protein caur_1924 from chloroflexus aurantiacus, target efi-511158, in complex with d-glucose
29% identity, 87% coverage: 31:333/349 of query aligns to 6:335/340 of 4rxuA

query
sites
4rxuA
V
 
V
A
 
G
F
 
I
L
 
V
M
 
L
P
 
P
D
 
T
Q
 
K
A
 
D
S
x
E
T
 
P
R
|
R
Y
 
W
E
 
I
E
 
Q
H
 
-
D
 
D
F
 
E
P
 
T
G
 
R
F
 
F
Q
 
R
K
 
E
S
 
A
M
 
L
G
 
Q
E
 
Q
L
 
A
C
 
G
P
 
Y
D
 
Q
C
 
V
T
 
E
V
 
I
I
 
L
Y
 
F
Q
 
-
N
 
-
A
 
S
N
 
Q
G
 
G
D
 
S
V
 
S
A
 
A
L
 
K
Q
 
E
Q
 
K
Q
 
E
Q
 
N
F
 
V
N
 
E
S
 
A
V
 
L
I
 
I
A
 
A
Q
 
K
G
 
G
A
 
I
K
 
K
I
 
V
V
 
L
V
 
I
L
 
I
D
 
C
P
 
P
V
 
H
D
 
D
S
 
G
A
 
T
A
 
A
A
 
A
A
 
A
S
 
A
M
 
A
V
 
A
E
 
E
I
 
A
A
 
A
H
 
R
S
 
A
Q
 
A
D
 
G
V
 
V
K
 
K
V
 
V
I
 
I
A
 
S
Y
 
Y
D
|
D
R
|
R
P
 
L
I
 
I
P
 
R
A
 
E
T
 
T
P
 
D
A
 
A
-
 
V
D
 
D
Y
 
Y
Y
 
Y
V
 
V
S
 
T
F
 
F
D
 
D
N
 
S
K
 
I
G
 
A
I
 
V
G
 
G
Q
 
A
A
 
Q
I
 
Q
A
 
A
Q
 
Q
S
 
Y
L
 
L
V
 
V
D
 
D
H
 
H
L
 
A
K
 
S
A
 
G
T
 
T
G
 
G
V
 
N
P
 
P
-
 
L
-
 
Y
-
 
L
-
 
Y
-
 
A
-
 
G
-
 
A
-
 
A
-
 
S
D
|
D
G
 
N
A
x
N
G
 
A
V
 
F
L
 
L
Q
 
F
I
 
F
N
 
E
G
 
G
S
 
A
-
 
W
-
 
K
-
 
V
-
 
L
-
 
Q
-
 
P
-
 
K
-
 
I
-
 
A
-
 
D
-
 
G
-
 
T
-
 
F
-
 
V
-
 
I
P
 
K
T
 
N
D
 
S
A
 
S
A
 
E
A
 
A
G
 
V
L
 
A
I
 
L
R
 
Q
D
 
N
G
 
K
I
 
L
D
 
D
A
 
L
A
 
T
L
 
R
D
 
D
A
 
E
S
 
M
G
 
A
Y
 
-
K
 
K
T
 
I
L
 
I
A
 
G
E
 
Q
F
 
V
D
 
-
T
 
T
P
 
T
D
 
N
W
|
W
A
 
D
P
 
F
P
 
N
K
 
T
A
 
A
Q
 
K
E
 
N
W
 
L
A
 
A
A
 
E
G
 
A
Q
 
N
I
 
L
T
 
T
R
 
A
F
 
A
G
 
T
D
 
A
E
 
A
I
 
D
K
 
K
G
 
G
-
 
K
-
 
V
-
 
Y
V
 
I
V
 
L
A
 
A
A
 
P
N
|
N
D
 
D
G
 
G
T
 
T
G
 
A
G
 
R
G
 
A
A
 
I
I
 
A
A
 
D
A
 
A
F
 
F
K
 
A
A
 
A
A
 
D
G
 
K
V
 
D
D
 
V
P
 
T
V
 
E
P
 
Y
P
 
F
V
 
V
T
 
T
G
 
G
N
 
Q
D
|
D
A
 
A
T
 
E
I
 
K
A
 
A
A
 
S
L
 
V
Q
 
Q
L
 
Y
I
 
I
I
 
I
S
 
D
G
 
G
D
 
R
Q
 
Q
Y
 
S
N
 
M
T
 
T
I
 
V
S
 
F
K
|
K
P
 
D
S
 
V
E
 
R
I
 
T
V
 
L
A
 
V
E
 
Q
A
 
D
A
 
A
A
 
I
K
 
K
V
 
A
A
 
A
V
 
V
T
 
A
F
 
L
L
 
L
K
 
Q
G
 
D
E
 
Q
T
 
Q
P
 
P
E
 
E
A
 
A
K
 
R
T
 
G
T
 
T
L
 
Y
Y
 
N
D
 
N
T
 
G
P
 
K
A
 
K
E
 
D
L
 
-
F
 
-
V
 
V
P
 
P
A
 
A
V
 
I
-
 
Q
-
 
S
-
 
P
-
 
V
-
 
V
-
 
T
V
 
V
T
 
T
A
 
R
E
 
D
N
 
N
I
 
V
K
 
R
A
 
A
E
 
A
I
 
L
F
 
I
D
 
D
K
 
S
G
 
G
I
 
Y
Q
 
Y
T
 
S
A
 
A
A
 
S
E
 
D

4ys6A Crystal structure of an abc transporter solute binding protein (ipr025997) from clostridium phytofermentans (cphy_1585, target efi- 511156) with bound beta-d-glucose
25% identity, 87% coverage: 31:334/349 of query aligns to 3:323/324 of 4ys6A

query
sites
4ys6A
V
 
V
A
 
G
F
 
V
L
 
A
M
 
M
P
 
P
D
 
T
Q
 
K
A
 
D
S
 
L
T
 
Q
R
|
R
Y
x
W
E
 
N
E
 
Q
H
 
-
D
 
D
F
 
G
P
 
S
G
 
N
F
 
M
Q
 
E
K
 
K
S
 
Q
M
 
L
G
 
K
E
 
D
L
 
A
C
 
G
P
 
Y
D
 
E
C
 
V
T
 
D
V
 
L
I
 
Q
Y
 
Y
Q
 
-
N
 
-
A
 
A
N
 
S
G
 
N
D
 
D
V
 
V
A
 
Q
L
 
T
Q
 
Q
Q
 
V
Q
 
S
Q
 
Q
F
 
I
N
 
E
S
 
N
V
 
M
I
 
I
A
 
S
Q
 
N
G
 
G
A
 
C
K
 
K
I
 
L
V
 
L
V
 
V
L
 
I
D
 
A
P
 
S
V
 
I
D
 
E
S
 
G
A
 
D
A
 
S
A
 
L
A
 
G
S
 
T
M
 
V
V
 
L
E
 
A
I
 
Q
A
 
A
H
 
K
S
 
K
Q
 
K
D
 
G
V
 
I
K
 
S
V
 
V
I
 
I
A
 
A
Y
 
Y
D
|
D
R
|
R
P
 
L
I
 
I
P
 
M
A
 
N
T
 
S
P
 
D
A
 
A
-
 
V
D
 
S
Y
 
Y
Y
 
Y
V
 
A
S
 
T
F
 
F
D
 
D
N
 
N
K
 
Y
G
 
M
I
 
V
G
 
G
Q
 
T
A
 
K
I
 
Q
A
 
G
Q
 
E
S
 
Y
L
 
I
V
 
K
D
 
E
H
 
K
L
 
L
K
 
N
A
 
L
T
 
E
G
 
T
V
 
A
P
 
K
D
 
G
G
 
P
A
 
F
G
 
N
V
 
L
L
 
E
Q
 
I
I
 
F
N
 
T
G
 
G
S
 
D
P
 
P
T
 
G
D
|
D
A
 
N
A
x
N
A
 
A
G
 
R
L
 
F
I
 
F
R
 
Y
D
 
G
G
 
G
I
 
A
D
 
M
A
 
D
A
 
V
L
 
L
D
 
K
-
 
P
-
 
Y
-
 
V
-
 
D
-
 
G
-
 
G
-
 
V
-
 
L
-
 
V
-
 
V
A
 
K
S
 
S
G
 
G
Y
 
S
K
 
V
T
 
A
L
 
F
A
 
E
E
 
K
F
 
V
D
 
A
T
 
T
P
 
A
D
 
G
W
|
W
A
 
S
P
 
T
P
 
E
K
 
T
A
 
A
Q
 
Q
E
 
N
W
 
R
A
 
M
A
 
D
G
 
A
Q
 
I
I
 
I
T
 
A
R
 
S
F
 
Y
-
 
Y
-
 
A
-
 
D
G
 
G
D
 
T
E
 
K
I
 
L
K
 
D
G
 
A
V
 
V
V
 
L
A
 
C
A
 
S
N
|
N
D
 
D
G
 
S
T
 
T
G
 
A
G
 
L
G
 
G
A
 
V
I
 
T
A
 
N
A
 
A
F
 
L
K
 
T
A
 
A
A
 
S
G
 
Y
V
 
K
D
 
G
P
 
E
V
 
W
P
 
P
P
 
I
V
 
V
T
 
T
G
 
G
N
 
Q
D
|
D
A
 
C
T
 
D
I
 
I
A
 
A
A
 
N
L
 
V
Q
 
K
L
 
N
I
 
M
I
 
L
S
 
D
G
 
G
D
 
K
Q
 
Q
Y
 
S
N
 
M
T
 
S
I
 
I
S
 
F
K
|
K
P
 
D
S
 
T
E
 
R
I
 
T
V
 
L
A
 
A
E
 
S
A
 
Q
A
 
V
A
 
V
K
 
K
V
 
M
A
 
V
V
 
D
T
 
A
F
 
I
L
 
M
K
 
K
-
 
G
G
 
G
E
 
E
T
 
A
P
 
P
E
 
V
A
 
N
K
 
D
T
 
T
T
 
K
L
 
S
Y
 
Y
D
 
D
T
 
N
-
 
G
-
 
N
-
 
G
-
 
I
-
 
V
P
 
P
A
 
S
E
 
Y
L
 
L
F
 
C
V
 
E
P
 
P
A
 
V
V
 
F
V
 
A
T
 
D
A
 
A
E
 
T
N
 
N
I
 
Y
K
 
K
A
 
E
E
 
L
I
 
L
F
 
I
D
 
D
K
 
S
G
 
G
I
 
Y
Q
 
Y
T
 
T
A
 
E
A
 
D
E
 
Q
V
 
L

2rjoA Crystal structure of twin-arginine translocation pathway signal protein from burkholderia phytofirmans
33% identity, 52% coverage: 87:266/349 of query aligns to 61:242/322 of 2rjoA

query
sites
2rjoA
G
 
G
A
 
N
K
 
L
I
 
V
V
 
L
V
 
N
L
 
V
D
|
D
P
 
P
V
 
N
D
 
D
S
 
S
A
 
A
A
 
D
A
 
A
A
 
R
S
 
V
M
 
I
V
 
V
E
 
E
I
 
A
A
 
C
H
 
S
S
 
K
Q
 
A
D
 
G
V
 
A
K
 
Y
V
 
V
I
 
T
A
 
T
-
 
I
Y
x
W
D
x
N
R
 
K
P
 
P
I
 
K
P
 
D
A
 
L
T
 
H
P
 
P
A
 
W
D
 
D
Y
 
Y
-
 
N
-
 
P
-
 
N
-
 
Y
-
 
V
-
 
A
Y
 
H
V
 
L
S
 
S
F
 
Y
D
 
D
N
 
G
K
 
V
G
 
A
I
 
Y
G
 
G
Q
 
E
A
 
E
I
 
T
A
 
A
Q
 
T
S
 
Q
L
 
L
V
 
F
D
 
K
H
 
S
L
 
M
K
 
G
A
 
G
T
 
K
G
 
G
V
 
-
P
 
-
D
 
-
G
 
-
A
 
-
G
 
G
V
 
V
L
 
V
Q
 
A
I
 
L
N
 
G
G
 
G
S
 
I
P
 
F
T
 
S
D
x
N
A
 
V
A
x
P
A
 
A
G
 
I
L
 
E
I
x
R
R
 
K
D
 
A
G
 
G
I
 
L
D
 
D
A
 
A
A
 
A
L
 
L
D
 
K
A
 
K
S
 
F
G
 
P
Y
 
G
K
 
I
T
 
Q
L
 
L
A
 
L
E
 
D
F
 
F
D
 
Q
T
 
V
P
 
A
D
 
D
W
|
W
A
 
N
P
 
S
P
 
Q
K
 
K
A
 
A
Q
 
F
E
 
P
W
 
I
A
 
M
A
 
Q
G
 
A
Q
 
W
I
 
M
T
 
T
R
 
R
F
 
F
G
 
N
D
 
S
E
 
K
I
 
I
K
 
K
G
 
G
V
 
V
V
 
W
A
 
A
A
 
A
N
 
N
D
 
D
G
 
D
T
 
M
G
 
A
G
 
L
G
 
G
A
 
A
I
 
I
A
 
E
A
 
A
F
 
L
K
 
R
A
 
A
A
 
E
G
 
G
V
 
L
D
 
A
P
 
G
V
 
Q
P
 
I
P
 
P
V
 
V
T
 
T
G
 
G
N
 
M
D
|
D
A
 
G
T
 
T
I
 
Q
A
 
P
A
 
G
L
 
L
Q
 
V
L
 
A
I
 
I
I
 
K
S
 
S
G
 
G
D
 
E

Sites not aligning to the query:

A0QYB3 Xylitol-binding protein from Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) (Mycobacterium smegmatis) (see paper)
29% identity, 75% coverage: 61:323/349 of query aligns to 63:311/349 of A0QYB3

query
sites
A0QYB3
D
 
N
C
 
I
T
 
E
V
 
L
I
 
V
Y
 
W
Q
 
N
N
 
S
A
 
A
N
 
N
G
 
N
D
 
D
V
 
V
A
 
S
L
 
T
Q
 
Q
Q
 
A
Q
 
S
Q
 
Q
F
 
V
N
 
D
S
 
S
V
 
L
I
 
I
A
 
N
Q
 
Q
G
 
G
A
 
V
K
 
D
I
 
A
V
 
I
V
 
I
L
 
V
D
 
V
P
 
P
V
 
V
D
 
Q
S
 
A
A
 
D
A
 
S
A
 
L
A
 
G
S
 
P
M
 
Q
V
 
V
E
 
A
I
 
S
A
 
A
H
 
K
S
 
S
Q
 
K
D
 
G
V
 
I
K
 
P
V
 
L
I
 
L
A
 
A
Y
 
V
D
x
N
R
 
A
P
 
A
I
 
L
P
 
E
A
 
T
T
 
P
P
 
D
A
 
L
D
 
A
Y
 
G
Y
 
N
V
 
V
S
 
Q
F
 
P
D
 
D
N
 
D
K
 
V
G
 
A
I
 
A
G
 
G
Q
 
A
A
 
Q
I
 
E
A
 
M
Q
 
Q
S
 
M
L
 
M
V
 
A
D
 
D
H
 
R
L
 
L
K
 
G
A
 
-
T
 
-
G
 
-
V
 
-
P
 
-
D
 
-
G
 
G
A
 
K
G
 
G
V
 
N
L
 
I
Q
 
V
I
 
I
N
 
L
G
 
Q
S
 
G
P
 
P
T
 
L
D
 
G
A
 
G
A
 
S
A
 
G
G
 
E
L
 
I
I
 
N
R
|
R
-
 
G
D
 
K
G
 
G
I
 
I
D
 
D
A
 
Q
A
 
V
L
 
L
-
 
A
D
 
K
A
 
Y
S
 
P
G
 
D
Y
 
I
K
 
K
T
 
V
L
 
L
A
 
A
E
 
K
F
 
-
D
 
D
T
 
T
P
 
A
D
 
N
W
 
W
A
 
K
P
 
R
P
 
D
K
 
E
A
 
A
Q
 
V
E
 
N
W
 
K
A
 
M
A
 
K
G
 
N
Q
 
W
I
 
I
T
 
S
R
 
S
F
 
F
G
 
G
D
 
P
E
 
Q
I
 
I
K
 
D
G
 
G
V
 
V
V
 
V
A
 
A
A
 
Q
N
|
N
D
 
D
G
 
D
T
 
M
G
 
G
G
 
L
G
 
G
A
 
A
I
 
L
A
 
Q
A
 
A
F
 
L
K
 
K
A
 
E
A
 
A
G
 
G
V
 
R
D
 
T
P
 
G
V
 
V
P
 
-
P
 
P
V
 
I
T
 
V
G
 
G
N
 
I
D
|
D
A
 
G
T
 
I
I
 
E
A
 
D
A
 
G
L
 
L
Q
 
N
L
 
A
I
 
V
I
 
K
S
 
S
G
 
G
D
 
D
Q
 
F
Y
 
I
N
 
G
T
 
T
I
 
S
S
 
L
K
x
Q
P
 
N
S
 
G
E
 
T
I
 
V
V
 
E
A
 
L
E
 
S
A
 
A
A
 
G
A
 
L
K
 
A
V
 
V
A
 
A
V
 
D
T
 
A
F
 
L
L
 
V
K
 
K
G
 
G
E
 
E
T
 
-
P
 
-
E
 
D
A
 
V
K
 
K
T
 
T
T
 
D
-
 
P
L
 
V
Y
 
Y
D
 
V
T
 
M
P
 
P
A
 
A
E
 
-
L
 
-
F
 
-
V
 
-
P
 
-
A
 
-
V
 
-
V
 
I
T
 
T
A
 
K
E
 
D
N
 
N
I
 
V
K
 
D
A
 
V
E
 
A
I
 
I

Sites not aligning to the query:

5hkoA Crystal structure of abc transporter solute binding protein msmeg_3598 from mycobacterium smegmatis str. Mc2 155, target efi-510969, in complex with l-sorbitol
29% identity, 75% coverage: 61:323/349 of query aligns to 30:278/314 of 5hkoA

query
sites
5hkoA
D
 
N
C
 
I
T
 
E
V
 
L
I
 
V
Y
 
W
Q
 
N
N
 
S
A
 
A
N
 
N
G
 
N
D
|
D
V
 
V
A
x
S
L
 
T
Q
 
Q
Q
 
A
Q
 
S
Q
 
Q
F
 
V
N
 
D
S
 
S
V
 
L
I
 
I
A
 
N
Q
 
Q
G
 
G
A
 
V
K
 
D
I
 
A
V
 
I
V
 
I
L
 
V
D
 
V
P
 
P
V
 
V
D
 
Q
S
 
A
A
 
D
A
 
S
A
 
L
A
 
G
S
 
P
M
 
Q
V
 
V
E
 
A
I
 
S
A
 
A
H
 
K
S
 
S
Q
 
K
D
 
G
V
 
I
K
 
P
V
 
L
I
 
L
A
 
A
Y
 
V
D
x
N
R
x
A
P
 
A
I
 
L
P
 
E
A
 
T
T
 
P
P
 
D
A
 
L
D
 
A
Y
 
G
Y
 
N
V
 
V
S
 
Q
F
 
P
D
 
D
N
 
D
K
 
V
G
 
A
I
 
A
G
 
G
Q
 
A
A
 
Q
I
 
E
A
 
M
Q
 
Q
S
 
M
L
 
M
V
 
A
D
 
D
H
 
R
L
 
L
K
 
G
A
 
-
T
 
-
G
 
-
V
 
-
P
 
-
D
 
-
G
 
G
A
 
K
G
 
G
V
 
N
L
 
I
Q
 
V
I
 
I
N
 
L
G
 
Q
S
 
G
P
 
P
T
 
L
D
 
G
A
 
G
A
 
S
A
 
G
G
 
E
L
 
I
I
 
N
R
|
R
-
 
G
D
 
K
G
 
G
I
 
I
D
 
D
A
 
Q
A
 
V
L
 
L
-
 
A
D
 
K
A
 
Y
S
 
P
G
 
D
Y
 
I
K
 
K
T
 
V
L
 
L
A
 
A
E
 
K
F
 
-
D
 
D
T
 
T
P
 
A
D
 
N
W
|
W
A
 
K
P
 
R
P
 
D
K
 
E
A
 
A
Q
 
V
E
 
N
W
 
K
A
 
M
A
 
K
G
 
N
Q
 
W
I
 
I
T
 
S
R
 
S
F
 
F
G
 
G
D
 
P
E
 
Q
I
 
I
K
 
D
G
 
G
V
 
V
V
 
V
A
 
A
A
 
Q
N
|
N
D
 
D
G
 
D
T
 
M
G
 
G
G
 
L
G
 
G
A
 
A
I
 
L
A
 
Q
A
 
A
F
 
L
K
 
K
A
 
E
A
 
A
G
 
G
V
 
R
D
 
T
P
 
G
V
 
V
P
 
-
P
 
P
V
 
I
T
 
V
G
 
G
N
 
I
D
|
D
A
 
G
T
 
I
I
x
E
A
 
D
A
 
G
L
 
L
Q
 
N
L
 
A
I
 
V
I
 
K
S
 
S
G
 
G
D
 
D
Q
 
F
Y
 
I
N
 
G
T
 
T
I
 
S
S
 
L
K
x
Q
P
 
N
S
 
G
E
 
T
I
 
V
V
 
E
A
 
L
E
 
S
A
 
A
A
 
G
A
 
L
K
 
A
V
 
V
A
 
A
V
 
D
T
 
A
F
 
L
L
 
V
K
 
K
G
 
G
E
 
E
T
 
-
P
 
-
E
 
D
A
 
V
K
 
K
T
 
T
T
 
D
-
 
P
L
 
V
Y
 
Y
D
 
V
T
 
M
P
 
P
A
 
A
E
 
-
L
 
-
F
 
-
V
 
-
P
 
-
A
 
-
V
 
-
V
 
I
T
 
T
A
 
K
E
 
D
N
 
N
I
 
V
K
 
D
A
 
V
E
 
A
I
 
I

Sites not aligning to the query:

4rs3A Crystal structure of carbohydrate transporter a0qyb3 from mycobacterium smegmatis str. Mc2 155, target efi-510969, in complex with xylitol (see paper)
29% identity, 75% coverage: 61:323/349 of query aligns to 30:278/315 of 4rs3A

query
sites
4rs3A
D
 
N
C
 
I
T
 
E
V
 
L
I
 
V
Y
 
W
Q
 
N
N
 
S
A
 
A
N
 
N
G
 
N
D
 
D
V
 
V
A
 
S
L
 
T
Q
 
Q
Q
 
A
Q
 
S
Q
 
Q
F
 
V
N
 
D
S
 
S
V
 
L
I
 
I
A
 
N
Q
 
Q
G
 
G
A
 
V
K
 
D
I
 
A
V
 
I
V
 
I
L
 
V
D
 
V
P
 
P
V
 
V
D
 
Q
S
 
A
A
 
D
A
 
S
A
 
L
A
 
G
S
 
P
M
 
Q
V
 
V
E
 
A
I
 
S
A
 
A
H
 
K
S
 
S
Q
 
K
D
 
G
V
 
I
K
 
P
V
 
L
I
 
L
A
 
A
Y
 
V
D
x
N
R
 
A
P
 
A
I
 
L
P
 
E
A
 
T
T
 
P
P
 
D
A
 
L
D
 
A
Y
 
G
Y
 
N
V
 
V
S
 
Q
F
 
P
D
 
D
N
 
D
K
 
V
G
 
A
I
 
A
G
 
G
Q
 
A
A
 
Q
I
 
E
A
 
M
Q
 
Q
S
 
M
L
 
M
V
 
A
D
 
D
H
 
R
L
 
L
K
 
G
A
 
-
T
 
-
G
 
-
V
 
-
P
 
-
D
 
-
G
 
G
A
 
K
G
 
G
V
 
N
L
 
I
Q
 
V
I
 
I
N
 
L
G
 
Q
S
 
G
P
 
P
T
 
L
D
 
G
A
 
G
A
 
S
A
 
G
G
 
E
L
 
I
I
 
N
R
|
R
-
 
G
D
 
K
G
 
G
I
 
I
D
 
D
A
 
Q
A
 
V
L
 
L
-
 
A
D
 
K
A
 
Y
S
 
P
G
 
D
Y
 
I
K
 
K
T
 
V
L
 
L
A
 
A
E
 
K
F
 
-
D
 
D
T
 
T
P
 
A
D
 
N
W
|
W
A
 
K
P
 
R
P
 
D
K
 
E
A
 
A
Q
 
V
E
 
N
W
 
K
A
 
M
A
 
K
G
 
N
Q
 
W
I
 
I
T
 
S
R
 
S
F
 
F
G
 
G
D
 
P
E
 
Q
I
 
I
K
 
D
G
 
G
V
 
V
V
 
V
A
 
A
A
 
Q
N
|
N
D
 
D
G
 
D
T
 
M
G
 
G
G
 
L
G
 
G
A
 
A
I
 
L
A
 
Q
A
 
A
F
 
L
K
 
K
A
 
E
A
 
A
G
 
G
V
 
R
D
 
T
P
 
G
V
 
V
P
 
-
P
 
P
V
 
I
T
 
V
G
 
G
N
 
I
D
|
D
A
 
G
T
 
I
I
x
E
A
 
D
A
 
G
L
 
L
Q
 
N
L
 
A
I
 
V
I
 
K
S
 
S
G
 
G
D
 
D
Q
 
F
Y
 
I
N
 
G
T
 
T
I
 
S
S
 
L
K
x
Q
P
 
N
S
 
G
E
 
T
I
 
V
V
 
E
A
 
L
E
 
S
A
 
A
A
 
G
A
 
L
K
 
A
V
 
V
A
 
A
V
 
D
T
 
A
F
 
L
L
 
V
K
 
K
G
 
G
E
 
E
T
 
-
P
 
-
E
 
D
A
 
V
K
 
K
T
 
T
T
 
D
-
 
P
L
 
V
Y
 
Y
D
 
V
T
 
M
P
 
P
A
 
A
E
 
-
L
 
-
F
 
-
V
 
-
P
 
-
A
 
-
V
 
-
V
 
I
T
 
T
A
 
K
E
 
D
N
 
N
I
 
V
K
 
D
A
 
V
E
 
A
I
 
I

Sites not aligning to the query:

A0QYB5 D-threitol-binding protein from Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) (Mycobacterium smegmatis) (see paper)
28% identity, 91% coverage: 6:323/349 of query aligns to 8:311/349 of A0QYB5

query
sites
A0QYB5
F
 
F
A
 
A
L
 
I
A
 
A
A
 
S
A
 
A
S
 
T
G
 
A
L
 
L
V
 
G
A
 
L
G
 
G
L
 
L
F
 
T
G
 
A
A
 
C
A
 
G
A
 
A
S
 
G
A
 
D
Q
 
P
E
 
A
A
 
A
A
 
N
T
 
S
V
 
-
A
 
-
F
 
-
L
 
-
M
 
-
P
 
-
D
 
D
Q
 
T
A
 
T
S
 
R
T
 
I
R
 
G
Y
 
V
E
 
T
E
 
V
H
x
Y
D
 
D
F
 
M
P
 
S
G
 
S
F
 
F
-
 
I
-
 
T
-
 
A
-
 
G
Q
 
K
K
 
E
S
 
G
M
 
M
G
 
D
E
 
A
L
 
Y
C
 
A
P
 
K
D
 
D
C
 
N
T
 
N
V
 
I
-
 
E
-
 
L
I
 
I
Y
 
W
Q
 
N
N
 
S
A
 
A
N
 
N
G
 
L
D
 
D
V
 
V
A
 
S
L
 
T
Q
 
Q
Q
 
A
Q
 
S
Q
 
Q
F
 
V
N
 
D
S
 
S
V
 
M
I
 
I
A
 
N
Q
 
Q
G
 
G
A
 
V
K
 
D
I
 
A
V
 
I
V
 
I
L
 
V
D
 
V
P
 
P
V
 
V
D
 
Q
S
 
A
A
 
D
A
 
S
A
 
L
A
 
A
S
 
P
M
 
Q
V
 
V
E
 
A
I
 
S
A
 
A
H
 
K
S
 
A
Q
 
K
D
 
G
V
 
I
K
 
P
V
 
L
I
 
V
A
 
P
Y
 
V
D
x
N
R
 
A
P
 
A
I
 
L
P
 
D
A
 
S
T
 
K
P
 
D
A
 
I
D
 
A
Y
 
G
Y
 
N
V
 
V
S
 
Q
F
 
P
D
 
D
N
 
D
K
 
V
G
 
A
I
 
A
G
 
G
Q
 
A
A
 
Q
I
 
E
A
 
M
Q
 
Q
S
 
M
L
 
M
V
 
A
D
 
D
H
 
R
L
 
L
K
 
G
A
 
-
T
 
-
G
 
-
V
 
-
P
 
-
D
 
-
G
 
G
A
 
K
G
 
G
V
 
N
L
 
I
Q
 
V
I
 
I
N
 
L
G
 
Q
S
 
G
P
 
P
T
 
L
D
 
G
A
 
Q
A
 
S
A
 
G
G
 
E
L
 
L
I
 
D
R
|
R
D
 
S
-
 
K
G
 
G
I
 
I
D
 
E
A
 
Q
A
 
V
L
 
L
-
 
A
D
 
K
A
 
Y
S
 
P
G
 
D
Y
 
I
K
 
K
T
 
V
L
 
L
A
 
A
E
 
K
F
 
-
D
 
D
T
 
T
P
 
A
D
 
N
W
 
W
A
 
K
P
 
R
P
 
D
K
 
E
A
 
A
Q
 
V
E
 
N
W
 
K
A
 
M
A
 
K
G
 
N
Q
 
W
I
 
I
T
 
S
R
 
G
F
 
F
G
 
G
D
 
P
E
 
Q
I
 
I
K
 
D
G
 
G
V
 
V
V
 
V
A
 
A
A
 
Q
N
|
N
D
 
D
G
 
D
T
 
M
G
 
G
G
 
L
G
 
G
A
 
A
I
 
L
A
 
Q
A
 
A
F
 
L
K
 
K
A
 
E
A
 
S
G
 
G
V
 
R
D
 
T
P
 
G
V
 
V
P
 
-
P
 
P
V
 
I
T
 
V
G
 
G
N
 
I
D
|
D
A
 
G
T
 
I
I
 
E
A
 
D
A
 
G
L
 
L
Q
 
N
L
 
A
I
 
V
I
 
K
S
 
S
G
 
G
D
 
D
Q
 
F
Y
 
I
N
 
G
T
 
T
I
 
S
S
 
L
K
x
Q
P
 
N
S
 
G
E
 
T
I
 
V
V
 
E
A
 
L
E
 
A
A
 
A
A
 
G
A
 
L
K
 
A
V
 
V
A
 
A
V
 
N
T
 
R
F
 
L
L
 
A
K
 
K
G
 
G
E
 
E
T
 
-
P
 
P
E
 
V
A
 
N
K
 
K
T
 
E
T
 
P
L
 
V
Y
 
Y
D
 
I
T
 
M
P
 
P
A
 
A
E
 
-
L
 
-
F
 
-
V
 
-
P
 
-
A
 
-
V
 
-
V
 
I
T
 
T
A
 
K
E
 
D
N
 
N
I
 
V
K
 
D
A
 
V
E
 
A
I
 
I

4rsmA Crystal structure of carbohydrate transporter msmeg_3599 from mycobacterium smegmatis str. Mc2 155, target efi-510970, in complex with d-threitol (see paper)
29% identity, 75% coverage: 61:323/349 of query aligns to 31:279/315 of 4rsmA

query
sites
4rsmA
D
 
N
C
 
I
T
 
E
V
 
L
I
 
I
Y
 
W
Q
 
N
N
 
S
A
 
A
N
 
N
G
 
L
D
 
D
V
 
V
A
 
S
L
 
T
Q
 
Q
Q
 
A
Q
 
S
Q
 
Q
F
 
V
N
 
D
S
 
S
V
 
M
I
 
I
A
 
N
Q
 
Q
G
 
G
A
 
V
K
 
D
I
 
A
V
 
I
V
 
I
L
 
V
D
 
V
P
 
P
V
 
V
D
 
Q
S
 
A
A
 
D
A
 
S
A
 
L
A
 
A
S
 
P
M
 
Q
V
 
V
E
 
A
I
 
S
A
 
A
H
 
K
S
 
A
Q
 
K
D
 
G
V
 
I
K
 
P
V
 
L
I
 
V
A
 
P
Y
 
V
D
x
N
R
 
A
P
 
A
I
 
L
P
 
D
A
 
S
T
 
K
P
 
D
A
 
I
D
 
A
Y
 
G
Y
 
N
V
 
V
S
 
Q
F
 
P
D
 
D
N
 
D
K
 
V
G
 
A
I
 
A
G
 
G
Q
 
A
A
 
Q
I
 
E
A
 
M
Q
 
Q
S
 
M
L
 
M
V
 
A
D
 
D
H
 
R
L
 
L
K
 
G
A
 
-
T
 
-
G
 
-
V
 
-
P
 
-
D
 
-
G
 
G
A
 
K
G
 
G
V
 
N
L
 
I
Q
 
V
I
 
I
N
 
L
G
 
Q
S
 
G
P
 
P
T
 
L
D
 
G
A
 
Q
A
 
S
A
 
G
G
 
E
L
 
L
I
 
D
R
|
R
D
 
S
-
 
K
G
 
G
I
 
I
D
 
E
A
 
Q
A
 
V
L
 
L
-
 
A
D
 
K
A
 
Y
S
 
P
G
 
D
Y
 
I
K
 
K
T
 
V
L
 
L
A
 
A
E
 
K
F
 
-
D
 
D
T
 
T
P
 
A
D
 
N
W
|
W
A
 
K
P
 
R
P
 
D
K
 
E
A
 
A
Q
 
V
E
 
N
W
 
K
A
 
M
A
 
K
G
 
N
Q
 
W
I
 
I
T
 
S
R
 
G
F
 
F
G
 
G
D
 
P
E
 
Q
I
 
I
K
 
D
G
 
G
V
 
V
V
 
V
A
 
A
A
 
Q
N
|
N
D
 
D
G
 
D
T
 
M
G
 
G
G
 
L
G
 
G
A
 
A
I
 
L
A
 
Q
A
 
A
F
 
L
K
 
K
A
 
E
A
 
S
G
 
G
V
 
R
D
 
T
P
 
G
V
 
V
P
 
-
P
 
P
V
 
I
T
 
V
G
 
G
N
 
I
D
|
D
A
 
G
T
 
I
I
 
E
A
 
D
A
 
G
L
 
L
Q
 
N
L
 
A
I
 
V
I
 
K
S
 
S
G
 
G
D
 
D
Q
 
F
Y
 
I
N
 
G
T
 
T
I
 
S
S
 
L
K
x
Q
P
 
N
S
 
G
E
 
T
I
 
V
V
 
E
A
 
L
E
 
A
A
 
A
A
 
G
A
 
L
K
 
A
V
 
V
A
 
A
V
 
N
T
 
R
F
 
L
L
 
A
K
 
K
G
 
G
E
 
E
T
 
-
P
 
P
E
 
V
A
 
N
K
 
K
T
 
E
T
 
P
L
 
V
Y
 
Y
D
 
I
T
 
M
P
 
P
A
 
A
E
 
-
L
 
-
F
 
-
V
 
-
P
 
-
A
 
-
V
 
-
V
 
I
T
 
T
A
 
K
E
 
D
N
 
N
I
 
V
K
 
D
A
 
V
E
 
A
I
 
I

Sites not aligning to the query:

8fxuA Thermoanaerobacter thermosaccharolyticum periplasmic glucose-binding protein glucose complex: badan conjugate attached at f17c (see paper)
28% identity, 70% coverage: 76:319/349 of query aligns to 47:306/310 of 8fxuA

query
sites
8fxuA
Q
 
Q
Q
 
N
Q
 
D
Q
 
Q
F
 
V
N
 
D
S
 
L
V
 
F
I
 
I
A
 
T
Q
 
K
G
 
K
A
 
M
K
 
N
I
 
A
V
 
L
V
 
A
L
 
I
D
 
N
P
 
P
V
 
V
D
 
D
S
 
R
A
 
T
A
 
A
A
 
A
A
 
G
S
 
T
M
 
I
V
 
I
E
 
D
I
 
K
A
 
A
H
 
K
S
 
Q
Q
 
A
D
 
N
V
 
I
K
 
P
V
 
V
I
 
V
A
 
F
Y
 
F
D
x
N
R
|
R
-
 
E
P
 
P
I
 
L
P
 
P
A
 
E
T
 
D
P
 
M
A
 
K
D
 
K
-
 
W
-
 
D
-
 
K
-
 
V
Y
 
Y
Y
 
Y
V
 
V
S
 
G
F
 
A
D
 
K
N
 
A
K
 
E
G
 
Q
I
 
S
G
 
G
Q
 
I
A
 
L
I
 
Q
A
 
G
Q
 
Q
S
 
I
L
 
M
V
 
A
D
 
D
H
 
Y
L
 
W
K
 
K
A
 
A
T
 
H
G
 
P
V
 
E
P
 
A
D
|
D
G
 
K
A
x
N
-
 
H
-
x
D
G
 
G
V
|
V
L
 
M
Q
|
Q
-
 
Y
-
 
V
-
 
M
I
 
L
N
 
M
G
 
G
S
 
Q
P
 
P
T
 
G
D
 
H
A
 
Q
A
x
D
A
 
A
G
 
I
L
 
L
I
x
R
R
 
T
D
 
Q
G
 
Y
I
 
S
D
 
I
A
 
Q
A
 
T
L
 
V
D
 
K
A
 
D
S
 
A
G
 
G
Y
 
I
K
 
K
T
 
V
-
 
Q
-
 
E
L
 
L
A
 
A
E
 
K
F
 
-
D
 
D
T
 
Y
P
 
A
D
 
N
W
|
W
A
 
D
P
 
R
P
 
V
K
 
T
A
 
A
Q
 
H
E
 
D
W
 
K
A
 
M
A
 
A
G
 
A
Q
 
W
I
 
L
T
 
S
R
 
S
F
 
F
G
 
G
D
 
D
E
 
K
I
 
I
K
x
E
G
 
A
V
 
V
V
 
F
A
 
A
A
 
N
N
|
N
D
 
D
G
 
D
T
 
M
G
 
A
G
 
L
G
 
G
A
 
A
I
 
I
A
 
E
A
 
A
F
 
L
K
 
K
A
 
S
A
 
A
G
 
G
-
 
Y
-
 
F
V
 
T
D
 
G
P
 
K
V
 
Y
P
 
I
P
 
P
V
 
V
T
 
V
G
 
G
N
 
V
D
|
D
A
|
A
T
|
T
I
 
A
A
 
P
A
 
G
L
 
I
Q
 
Q
L
 
A
I
 
I
I
 
K
S
 
D
G
 
G
D
 
T
Q
 
L
Y
 
L
N
 
G
T
 
T
I
 
V
S
 
L
K
x
N
P
 
D
S
 
A
E
 
K
I
 
N
V
 
Q
A
 
A
E
 
K
A
 
A
A
 
T
A
 
F
K
 
N
V
 
I
A
 
A
V
 
Y
T
 
E
F
 
L
L
 
A
K
 
Q
G
 
G
E
 
I
T
 
T
P
 
P
E
 
T
A
 
K
K
 
D
T
 
N
T
 
I
L
 
G
Y
 
Y
D
 
D
T
 
I
P
 
T
-
 
D
-
 
G
A
 
K
E
 
Y
L
 
V
F
 
W
V
 
I
P
 
P
-
 
Y
A
 
K
V
 
K
V
 
I
T
 
T
A
 
K
E
 
D
N
 
N
I
 
I

Sites not aligning to the query:

4zjpA Structure of an abc-transporter solute binding protein (sbp_ipr025997) from actinobacillus succinogenes (asuc_0197, target efi-511067) with bound beta-d-ribopyranose
28% identity, 71% coverage: 50:298/349 of query aligns to 23:260/270 of 4zjpA

query
sites
4zjpA
G
 
G
F
 
A
Q
 
Q
K
 
K
S
 
K
M
 
A
G
 
T
E
 
E
L
 
L
C
 
G
P
 
Y
D
 
K
C
 
L
T
 
V
V
 
V
I
 
L
Y
 
-
Q
 
-
N
 
D
A
 
S
N
 
Q
G
 
N
D
 
D
V
 
P
A
 
S
L
 
K
Q
 
E
Q
 
L
Q
 
S
Q
 
N
F
 
V
N
 
E
S
 
D
V
 
L
I
 
T
A
 
V
Q
 
R
G
 
G
A
 
A
K
 
K
I
 
V
V
 
L
V
 
L
L
 
I
D
 
N
P
 
P
V
 
T
D
 
D
S
 
S
A
 
A
A
 
A
A
 
V
A
 
S
S
 
N
M
 
A
V
 
V
E
 
A
I
 
I
A
 
A
H
 
N
S
 
R
Q
 
N
D
 
K
V
 
I
K
 
P
V
 
V
I
 
I
A
 
T
Y
 
L
D
|
D
R
|
R
P
 
G
I
 
A
P
 
A
A
 
K
T
 
G
P
 
E
A
 
V
D
 
V
Y
 
S
Y
 
H
V
 
I
S
 
A
F
 
S
D
 
D
N
 
N
-
 
V
-
 
A
-
 
G
-
 
G
K
 
K
G
 
M
I
 
A
G
 
G
Q
 
D
A
 
F
I
 
I
A
 
A
Q
 
Q
S
 
K
L
 
L
V
 
-
D
 
-
H
 
-
L
 
-
K
 
-
A
 
-
T
 
-
G
 
-
V
 
-
P
 
G
D
 
D
G
 
G
A
 
A
G
 
K
V
 
V
L
 
I
Q
 
Q
I
 
L
N
 
E
G
 
G
S
 
L
P
 
A
T
 
G
D
 
T
A
 
S
A
 
A
A
 
A
G
 
R
L
 
E
I
x
R
R
 
G
D
 
E
G
 
G
I
 
F
D
 
K
A
 
Q
A
 
A
L
 
I
D
 
E
A
 
A
S
 
H
G
 
K
Y
 
F
K
 
D
T
 
V
L
 
L
A
 
A
E
 
S
F
 
-
D
 
Q
T
 
P
P
 
A
D
 
D
W
x
F
A
 
D
P
 
R
P
 
T
K
 
K
A
 
G
Q
 
L
E
 
N
W
 
V
A
 
T
A
 
E
G
 
N
Q
 
L
I
 
L
T
 
A
R
 
S
F
 
K
G
 
G
D
 
-
E
 
S
I
 
V
K
 
Q
G
 
A
V
 
I
V
 
F
A
 
A
A
 
Q
N
|
N
D
 
D
G
 
E
T
 
M
G
 
A
G
 
L
G
 
G
A
 
A
I
 
L
A
 
R
A
 
A
F
 
I
K
 
S
A
 
A
A
 
A
G
 
G
V
 
K
D
 
K
P
 
V
V
 
L
P
 
-
P
 
-
V
 
V
T
 
V
G
 
G
N
 
F
D
|
D
A
 
G
T
 
T
I
 
E
A
 
D
A
 
G
L
 
V
Q
 
K
L
 
A
I
 
V
I
 
K
S
 
S
G
 
G
D
 
K
Q
 
L
Y
 
A
N
 
A
T
 
T
I
 
V
S
 
A
K
x
Q
P
 
Q
S
 
P
E
 
E
I
 
L
V
 
I
A
 
G
E
 
S
A
 
L
A
 
G
A
 
V
K
 
E
V
 
T
A
 
A
V
 
D
T
 
K
F
 
I
L
 
L
K
 
K
G
 
G
E
 
E
T
 
K
P
 
V
E
 
D
A
 
A
K
 
K

Sites not aligning to the query:

P23905 D-galactose/methyl-galactoside binding periplasmic protein MglB; D-galactose-binding periplasmic protein; GBP; D-galactose/D-glucose-binding protein; GGBP from Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) (see 2 papers)
26% identity, 84% coverage: 1:293/349 of query aligns to 1:299/332 of P23905

query
sites
P23905
M
 
M
T
 
N
S
 
K
R
 
K
T
 
V
F
 
L
A
 
T
L
 
L
A
 
S
A
 
A
A
 
V
S
 
-
G
 
-
L
 
M
V
 
A
A
 
S
G
 
L
L
 
L
F
 
F
G
 
G
A
 
A
A
 
H
A
 
A
S
 
H
A
 
A
Q
 
A
E
 
D
A
 
T
A
 
R
T
 
I
V
 
G
A
 
V
F
 
T
L
 
I
M
 
Y
P
 
-
D
 
-
Q
 
-
A
 
-
S
 
-
T
 
-
R
 
K
Y
 
Y
E
 
D
E
x
D
H
 
N
D
 
F
F
 
M
P
 
S
G
 
V
F
 
V
Q
 
R
K
 
K
S
 
A
M
 
I
-
 
E
-
 
K
-
 
D
G
 
G
E
 
K
L
 
S
C
 
A
P
 
P
D
 
D
C
 
V
T
 
Q
V
 
L
I
 
L
Y
 
M
Q
 
N
N
 
D
A
 
S
N
 
Q
G
 
N
D
 
D
V
 
Q
A
 
S
L
 
K
Q
 
Q
Q
 
N
Q
 
D
Q
 
Q
F
 
I
N
 
D
S
 
V
V
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
K
 
K
I
 
A
V
 
L
V
 
A
L
 
I
D
 
N
P
 
L
V
 
V
D
 
D
S
 
P
A
 
A
A
 
A
A
 
A
A
 
G
S
 
T
M
 
V
V
 
I
E
 
E
I
 
K
A
 
A
H
 
R
S
 
G
Q
 
Q
D
 
N
V
 
V
K
 
P
V
 
V
I
 
V
A
 
F
Y
 
F
D
x
N
R
 
K
P
 
E
I
 
P
P
 
S
A
 
R
T
 
K
P
 
A
A
 
L
D
 
D
-
 
S
-
 
Y
-
 
D
-
 
K
-
 
A
Y
 
Y
Y
 
Y
V
 
V
S
 
G
F
 
T
D
 
D
N
 
S
K
 
K
G
 
E
I
 
S
G
 
G
Q
 
V
A
 
I
I
 
Q
A
 
G
Q
 
D
S
 
L
L
 
I
V
 
A
D
 
K
H
 
H
L
 
W
K
 
Q
A
 
A
T
 
N
G
 
Q
V
 
G
P
 
W
D
|
D
-
 
L
-
x
N
G
 
K
A
x
D
G
 
G
V
x
K
L
 
I
Q
|
Q
-
 
Y
-
 
V
-
 
L
I
 
L
N
 
K
G
 
G
S
 
E
P
 
P
T
 
G
D
x
H
A
 
P
A
x
D
A
 
A
G
 
E
L
 
A
I
x
R
R
 
T
D
 
T
G
 
Y
I
 
V
D
 
V
A
 
K
A
 
E
L
 
L
D
 
N
A
 
D
S
 
K
G
 
G
Y
 
I
K
 
Q
T
 
T
-
 
E
-
 
Q
L
 
L
A
 
A
E
 
-
F
 
L
D
 
D
T
 
T
P
 
A
D
 
M
W
 
W
-
 
D
-
 
T
-
 
A
-
 
Q
A
 
A
P
 
K
P
 
D
K
 
K
A
 
M
Q
 
D
E
 
A
W
 
W
A
 
L
A
 
S
G
 
G
Q
 
P
I
 
-
T
 
-
R
 
-
F
 
N
G
 
A
D
 
N
E
 
K
I
 
I
K
x
E
G
 
V
V
 
V
V
 
I
A
 
A
A
 
N
N
|
N
D
 
D
G
 
A
T
 
M
G
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
F
 
L
K
 
K
A
 
A
A
 
H
G
 
N
V
 
K
D
 
S
P
 
S
V
 
I
P
 
-
P
 
P
V
 
V
T
 
F
G
 
G
N
 
V
D
|
D
A
 
A
T
 
L
I
 
P
A
 
E
A
 
A
L
 
L
Q
 
A
L
 
L
I
 
V
I
 
K
S
 
S
G
 
G
D
 
A
Q
 
M
Y
 
A
N
 
G
T
 
T
I
 
V
S
 
L
K
x
N
P
 
D
S
 
A
E
 
N
I
 
N
V
 
Q
A
 
A
E
 
K
A
 
A
A
 
T
A
 
F
K
 
D
V
 
L
A
 
A
V
 
K
T
 
N
F
 
L
L
 
A
K
 
E
G
 
G
E
 
K

P0AEE5 D-galactose/methyl-galactoside binding periplasmic protein MglB; D-galactose-binding periplasmic protein; GBP; D-galactose/D-glucose-binding protein; GGBP from Escherichia coli (strain K12) (see 4 papers)
27% identity, 76% coverage: 1:265/349 of query aligns to 1:271/332 of P0AEE5

query
sites
P0AEE5
M
|
M
T
x
N
S
x
K
R
x
K
T
x
V
F
x
L
A
x
T
L
|
L
A
x
S
A
|
A
A
x
V
S
 
-
G
 
-
L
x
M
V
x
A
A
x
S
G
x
M
L
|
L
F
|
F
G
|
G
A
|
A
A
|
A
A
|
A
S
x
H
A
|
A
Q
 
A
E
 
D
A
 
T
A
 
R
T
 
I
V
 
G
A
 
V
F
 
T
L
 
I
M
 
Y
P
 
-
D
 
-
Q
 
-
A
 
-
S
 
-
T
 
-
R
 
K
Y
 
Y
E
 
D
E
x
D
H
 
N
D
 
F
F
 
M
P
 
S
G
 
V
F
 
V
Q
 
R
K
 
K
S
 
A
M
 
I
-
 
E
-
 
Q
-
 
D
G
 
A
E
 
K
L
 
A
C
 
A
P
 
P
D
 
D
C
 
V
T
 
Q
V
 
L
I
 
L
Y
 
M
Q
 
N
N
 
D
A
 
S
N
 
Q
G
 
N
D
 
D
V
 
Q
A
 
S
L
 
K
Q
 
Q
Q
 
N
Q
 
D
Q
 
Q
F
 
I
N
 
D
S
 
V
V
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
K
 
K
I
 
A
V
 
L
V
 
A
L
 
I
D
 
N
P
 
L
V
 
V
D
 
D
S
 
P
A
 
A
A
 
A
A
 
A
A
 
G
S
 
T
M
 
V
V
 
I
E
 
E
I
 
K
A
 
A
H
 
R
S
 
G
Q
 
Q
D
 
N
V
 
V
K
 
P
V
 
V
I
 
V
A
 
F
Y
 
F
D
x
N
R
 
K
P
 
E
I
 
P
P
 
S
A
 
R
T
 
K
P
 
A
A
 
L
D
 
D
-
 
S
-
 
Y
-
 
D
-
 
K
-
 
A
Y
 
Y
Y
 
Y
V
 
V
S
 
G
F
 
T
D
 
D
N
 
S
K
 
K
G
 
E
I
 
S
G
 
G
Q
 
I
A
 
I
I
 
Q
A
 
G
Q
 
D
S
 
L
L
 
I
V
 
A
D
 
K
H
 
H
L
 
W
K
 
A
A
 
A
T
 
N
G
 
Q
V
 
G
P
 
W
D
|
D
-
 
L
-
x
N
G
 
K
A
x
D
G
 
G
V
x
Q
L
 
I
Q
|
Q
-
 
F
-
 
V
-
 
L
I
 
L
N
 
K
G
 
G
S
 
E
P
 
P
T
 
G
D
x
H
A
 
P
A
x
D
A
 
A
G
 
E
L
 
A
I
x
R
R
 
T
D
 
T
G
 
Y
I
 
V
D
 
I
A
 
K
A
 
E
L
 
L
D
 
N
A
 
D
S
 
K
G
 
G
Y
 
I
K
 
K
T
 
T
-
 
E
L
 
Q
A
 
L
E
 
Q
F
 
L
D
 
D
T
 
T
P
 
A
D
 
M
W
 
W
-
 
D
-
 
T
-
 
A
-
 
Q
A
 
A
P
 
K
P
 
D
K
 
K
A
 
M
Q
 
D
E
 
A
W
 
W
A
 
L
A
 
S
G
 
G
Q
 
P
I
 
-
T
 
-
R
 
-
F
 
N
G
 
A
D
 
N
E
 
K
I
 
I
K
x
E
G
 
V
V
 
V
V
 
I
A
 
A
A
 
N
N
|
N
D
 
D
G
 
A
T
 
M
G
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
F
 
L
K
 
K
A
 
A
A
 
H
G
 
N
V
 
K
D
 
S
P
 
S
V
 
I
P
 
-
P
 
P
V
 
V
T
 
F
G
 
G
N
 
V
D
|
D
A
 
A
T
 
L
I
 
P
A
 
E
A
 
A
L
 
L
Q
 
A
L
 
L
I
 
V
I
 
K
S
 
S
G
 
G

Sites not aligning to the query:

5kwsA Crystal structure of galactose binding protein from yersinia pestis in the complex with beta d glucose
27% identity, 70% coverage: 59:302/349 of query aligns to 31:284/307 of 5kwsA

query
sites
5kwsA
C
 
S
P
 
P
D
 
E
C
 
I
T
 
T
V
 
L
I
 
L
Y
 
M
Q
 
N
N
 
D
A
 
S
N
 
Q
G
 
N
D
 
D
V
 
Q
A
 
S
L
 
K
Q
 
Q
Q
 
N
Q
 
D
Q
 
Q
F
 
I
N
 
D
S
 
V
V
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
K
 
K
I
 
A
V
 
L
V
 
A
L
 
I
D
 
N
P
 
L
V
 
V
D
 
D
S
 
P
A
 
A
A
 
A
A
 
A
A
 
P
S
 
V
M
 
V
V
 
I
E
 
D
I
 
K
A
 
A
H
 
R
S
 
S
Q
 
N
D
 
D
V
 
I
K
 
P
V
 
I
I
 
V
A
 
F
Y
 
Y
D
x
N
R
x
K
P
 
E
I
 
P
P
 
S
A
 
R
T
 
K
P
 
A
A
 
L
D
 
D
-
 
S
-
 
Y
-
 
D
-
 
K
-
 
A
Y
 
Y
Y
 
Y
V
 
V
S
 
G
F
 
T
D
 
D
N
 
S
K
 
K
G
 
E
I
 
S
G
 
G
Q
 
V
A
 
I
I
 
Q
A
 
G
Q
 
E
S
 
L
L
 
I
V
 
A
D
 
K
H
 
H
L
 
W
K
 
Q
A
 
A
T
 
N
G
 
P
V
 
E
P
 
W
D
|
D
-
 
L
-
x
N
G
 
K
A
x
D
G
 
G
V
x
K
L
 
I
Q
|
Q
-
 
F
-
 
V
-
 
L
I
 
L
N
 
K
G
 
G
S
 
E
P
 
P
T
 
G
D
x
H
A
 
P
A
x
D
A
 
A
G
 
E
L
 
A
I
x
R
R
 
T
D
 
T
G
 
Y
I
 
V
D
 
I
A
 
K
A
 
T
L
 
L
D
 
N
A
 
E
S
 
K
G
 
G
Y
 
L
K
 
P
T
 
T
L
 
Q
A
 
Q
-
 
L
E
 
Q
F
 
L
D
 
D
T
 
T
P
 
A
D
 
M
W
|
W
-
 
D
-
 
T
-
 
A
-
 
Q
A
 
A
P
 
K
P
 
D
K
 
K
A
 
M
Q
 
D
E
 
A
W
 
W
A
 
L
A
 
S
G
 
G
Q
 
P
I
 
-
T
 
-
R
 
-
F
 
N
G
 
A
D
 
N
E
 
K
I
 
I
K
x
E
G
 
V
V
 
V
V
 
I
A
 
A
A
 
N
N
|
N
D
 
D
G
 
A
T
 
M
G
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
F
 
L
K
 
K
A
 
A
A
 
H
G
 
N
V
 
K
D
 
T
P
 
S
V
 
V
P
 
-
P
 
P
V
 
V
T
 
F
G
 
G
N
 
V
D
|
D
A
 
A
T
 
L
I
 
P
A
 
E
A
 
A
L
 
L
Q
 
A
L
 
L
I
 
V
I
 
K
S
 
S
G
 
G
D
 
Q
Q
 
M
Y
 
A
N
 
G
T
 
T
I
 
V
S
 
L
K
x
N
P
 
D
S
 
A
E
 
N
I
 
N
V
 
Q
A
 
A
E
 
K
A
 
A
A
 
T
A
 
F
K
 
D
V
 
L
A
 
A
V
 
K
T
 
N
F
 
L
L
 
A
K
 
A
G
 
G
E
 
K
T
 
-
P
 
P
E
 
A
A
 
A
K
 
E
T
 
G
T
 
T
L
 
T
Y
 
W

Sites not aligning to the query:

3ga5A X-ray structure of glucose/galactose receptor from salmonella typhimurium in complex with (2r)-glyceryl-beta-d-galactopyranoside (see paper)
27% identity, 72% coverage: 42:293/349 of query aligns to 9:274/305 of 3ga5A

query
sites
3ga5A
R
 
K
Y
 
Y
E
 
D
E
x
D
H
 
N
D
x
F
F
 
M
P
 
S
G
 
V
F
 
V
Q
 
R
K
 
K
S
 
A
M
 
I
-
 
E
-
 
K
-
 
D
G
 
G
E
 
K
L
 
S
C
 
A
P
 
P
D
 
D
C
 
V
T
 
Q
V
 
L
I
 
L
Y
 
M
Q
 
N
N
 
D
A
 
S
N
 
Q
G
 
N
D
 
D
V
 
Q
A
 
S
L
 
K
Q
 
Q
Q
 
N
Q
 
D
Q
 
Q
F
 
I
N
 
D
S
 
V
V
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
K
 
K
I
 
A
V
 
L
V
 
A
L
 
I
D
 
N
P
 
L
V
 
V
D
 
D
S
 
P
A
 
A
A
 
A
A
 
A
A
 
G
S
 
T
M
 
V
V
 
I
E
 
E
I
 
K
A
 
A
H
 
R
S
 
G
Q
 
Q
D
 
N
V
 
V
K
 
P
V
 
V
I
 
V
A
 
F
Y
 
F
D
x
N
R
x
K
P
 
E
I
 
P
P
 
S
A
 
R
T
 
K
P
 
A
A
 
L
D
 
D
-
 
S
-
 
Y
-
 
D
-
 
K
-
 
A
Y
 
Y
Y
 
Y
V
 
V
S
 
G
F
x
T
D
 
D
N
 
S
K
 
K
G
 
E
I
 
S
G
 
G
Q
 
V
A
 
I
I
 
Q
A
 
G
Q
 
D
S
 
L
L
 
I
V
 
A
D
 
K
H
 
H
L
 
W
K
 
Q
A
 
A
T
 
N
G
 
Q
V
 
G
P
 
W
D
|
D
-
 
L
-
x
N
G
 
K
A
x
D
G
 
G
V
x
K
L
 
I
Q
|
Q
-
 
Y
-
 
V
-
 
L
I
 
L
N
 
K
G
 
G
S
 
E
P
 
P
T
 
G
D
x
H
A
 
P
A
x
D
A
 
A
G
 
E
L
 
A
I
x
R
R
 
T
D
 
T
G
 
Y
I
 
V
D
 
V
A
 
K
A
 
E
L
 
L
D
 
N
A
 
D
S
 
K
G
 
G
Y
 
I
K
 
Q
T
 
T
-
 
E
-
 
Q
L
 
L
A
 
A
E
 
-
F
 
L
D
 
D
T
 
T
P
 
A
D
 
M
W
|
W
-
 
D
-
 
T
-
 
A
-
 
Q
A
 
A
P
 
K
P
 
D
K
 
K
A
 
M
Q
 
D
E
 
A
W
 
W
A
 
L
A
 
S
G
 
G
Q
 
P
I
 
-
T
 
-
R
 
-
F
 
N
G
 
A
D
 
N
E
 
K
I
 
I
K
x
E
G
 
V
V
 
V
V
 
I
A
 
A
A
 
N
N
|
N
D
 
D
G
 
A
T
 
M
G
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
F
 
L
K
 
K
A
 
A
A
 
H
G
 
N
V
 
K
D
 
S
P
 
S
V
 
I
P
 
-
P
 
P
V
 
V
T
 
F
G
 
G
N
 
V
D
|
D
A
 
A
T
 
L
I
 
P
A
 
E
A
 
A
L
 
L
Q
 
A
L
 
L
I
 
V
I
 
K
S
 
S
G
 
G
D
 
A
Q
 
M
Y
 
A
N
 
G
T
 
T
I
 
V
S
 
L
K
x
N
P
 
D
S
 
A
E
 
N
I
 
N
V
x
Q
A
 
A
E
 
K
A
 
A
A
 
T
A
 
F
K
 
D
V
 
L
A
 
A
V
 
K
T
 
N
F
 
L
L
 
A
K
 
E
G
 
G
E
 
K

1gcaA The 1.7 angstroms refined x-ray structure of the periplasmic glucose(slash)galactose receptor from salmonella typhimurium (see paper)
27% identity, 72% coverage: 42:293/349 of query aligns to 11:276/309 of 1gcaA

query
sites
1gcaA
R
 
K
Y
 
Y
E
 
D
E
x
D
H
 
N
D
x
F
F
 
M
P
 
S
G
 
V
F
 
V
Q
 
R
K
 
K
S
 
A
M
 
I
-
 
E
-
 
K
-
 
D
G
 
G
E
 
K
L
 
S
C
 
A
P
 
P
D
 
D
C
 
V
T
 
Q
V
 
L
I
 
L
Y
 
M
Q
 
N
N
 
D
A
 
S
N
 
Q
G
 
N
D
 
D
V
 
Q
A
 
S
L
 
K
Q
 
Q
Q
 
N
Q
 
D
Q
 
Q
F
 
I
N
 
D
S
 
V
V
 
L
I
 
L
A
 
A
Q
 
K
G
 
G
A
 
V
K
 
K
I
 
A
V
 
L
V
 
A
L
 
I
D
 
N
P
 
L
V
 
V
D
 
D
S
 
P
A
 
A
A
 
A
A
 
A
A
 
G
S
 
T
M
 
V
V
 
I
E
 
E
I
 
K
A
 
A
H
 
R
S
 
G
Q
 
Q
D
 
N
V
 
V
K
 
P
V
 
V
I
 
V
A
 
F
Y
 
F
D
x
N
R
x
K
P
 
E
I
 
P
P
 
S
A
 
R
T
 
K
P
 
A
A
 
L
D
 
D
-
 
S
-
 
Y
-
 
D
-
 
K
-
 
A
Y
 
Y
Y
 
Y
V
 
V
S
 
G
F
 
T
D
 
D
N
 
S
K
 
K
G
 
E
I
 
S
G
 
G
Q
 
V
A
 
I
I
 
Q
A
 
G
Q
 
D
S
 
L
L
 
I
V
 
A
D
 
K
H
 
H
L
 
W
K
 
Q
A
 
A
T
 
N
G
 
Q
V
 
G
P
 
W
D
|
D
-
 
L
-
x
N
G
 
K
A
x
D
G
 
G
V
x
K
L
 
I
Q
|
Q
-
 
Y
-
 
V
-
 
L
I
 
L
N
 
K
G
 
G
S
 
E
P
 
P
T
 
G
D
x
H
A
 
P
A
x
D
A
 
A
G
 
E
L
 
A
I
x
R
R
 
T
D
 
T
G
 
Y
I
 
V
D
 
V
A
 
K
A
 
E
L
 
L
D
 
N
A
 
D
S
 
K
G
 
G
Y
 
I
K
 
Q
T
 
T
-
 
E
-
 
Q
L
 
L
A
 
A
E
 
-
F
 
L
D
 
D
T
 
T
P
 
A
D
 
M
W
 
W
-
 
D
-
 
T
-
 
A
-
 
Q
A
 
A
P
 
K
P
 
D
K
 
K
A
 
M
Q
 
D
E
 
A
W
 
W
A
 
L
A
 
S
G
 
G
Q
 
P
I
 
-
T
 
-
R
 
-
F
 
N
G
 
A
D
 
N
E
 
K
I
 
I
K
x
E
G
 
V
V
 
V
V
 
I
A
 
A
A
 
N
N
|
N
D
 
D
G
 
A
T
 
M
G
 
A
G
 
M
G
 
G
A
 
A
I
 
V
A
 
E
A
 
A
F
 
L
K
 
K
A
 
A
A
 
H
G
 
N
V
 
K
D
 
S
P
 
S
V
 
I
P
 
-
P
 
P
V
 
V
T
 
F
G
 
G
N
 
V
D
|
D
A
 
A
T
 
L
I
 
P
A
 
E
A
 
A
L
 
L
Q
 
A
L
 
L
I
 
V
I
 
K
S
 
S
G
 
G
D
 
A
Q
 
M
Y
 
A
N
 
G
T
 
T
I
 
V
S
 
L
K
x
N
P
 
D
S
 
A
E
 
N
I
 
N
V
 
Q
A
 
A
E
 
K
A
 
A
A
 
T
A
 
F
K
 
D
V
 
L
A
 
A
V
 
K
T
 
N
F
 
L
L
 
A
K
 
E
G
 
G
E
 
K

Query Sequence

>WP_069330983.1 NCBI__GCF_003046325.1:WP_069330983.1
MTSRTFALAAASGLVAGLFGAAASAQEAATVAFLMPDQASTRYEEHDFPGFQKSMGELCP
DCTVIYQNANGDVALQQQQFNSVIAQGAKIVVLDPVDSAAAASMVEIAHSQDVKVIAYDR
PIPATPADYYVSFDNKGIGQAIAQSLVDHLKATGVPDGAGVLQINGSPTDAAAGLIRDGI
DAALDASGYKTLAEFDTPDWAPPKAQEWAAGQITRFGDEIKGVVAANDGTGGGAIAAFKA
AGVDPVPPVTGNDATIAALQLIISGDQYNTISKPSEIVAEAAAKVAVTFLKGETPEAKTT
LYDTPAELFVPAVVTAENIKAEIFDKGIQTAAEVCTGEYAEGCAKLGIQ

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory