SitesBLAST – Find functional sites

 

SitesBLAST

Comparing GFF2035 FitnessBrowser__Phaeo:GFF2035 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

A3QCW5 C4-dicarboxylate-binding periplasmic protein DctP from Shewanella loihica (strain ATCC BAA-1088 / PV-4) (see paper)
53% identity, 90% coverage: 31:330/333 of query aligns to 36:335/336 of A3QCW5

query
sites
A3QCW5
V
 
I
K
 
K
F
 
F
S
 
S
H
 
H
V
 
V
T
 
V
N
 
-
T
 
A
D
 
E
K
 
N
H
 
T
P
 
P
K
|
K
G
 
G
I
 
Q
A
 
M
A
 
A
S
 
L
L
 
K
L
 
F
E
 
K
K
 
Q
R
 
L
I
 
V
N
 
E
E
 
E
E
 
R
M
 
L
N
 
P
G
 
G
T
 
E
M
 
Y
C
 
Q
L
 
V
E
 
N
V
 
V
Y
 
F
P
 
P
N
 
N
S
 
S
T
 
Q
L
 
L
Y
 
F
N
 
G
D
 
D
N
 
N
K
 
N
V
 
E
L
 
L
E
 
S
A
 
A
M
 
L
L
 
L
Q
 
L
G
 
N
D
 
D
V
 
V
Q
 
Q
L
 
F
A
 
V
A
 
A
P
 
P
S
 
S
L
 
L
S
 
S
K
|
K
F
 
F
E
 
E
K
 
R
F
 
Y
T
 
T
K
 
K
Q
 
K
F
 
L
R
 
Q
L
 
L
F
 
F
D
 
D
L
 
L
P
 
P
F
 
F
M
 
L
F
 
F
K
 
K
N
 
D
I
 
M
D
 
D
A
 
A
V
 
V
D
 
N
A
 
R
F
 
F
Q
 
Q
G
 
Q
S
 
S
E
 
D
N
 
A
G
 
G
Q
 
Q
A
 
Q
M
 
L
L
 
L
D
 
N
S
 
S
M
 
M
Q
 
K
R
 
R
R
 
K
G
 
G
L
 
V
Q
 
V
G
 
G
L
 
L
S
 
G
Y
 
Y
W
 
L
H
 
H
N
 
N
G
 
G
M
 
M
K
 
K
Q
 
Q
M
 
F
S
 
S
A
 
A
N
 
S
K
 
S
P
 
P
L
 
L
I
 
V
N
 
L
P
 
P
S
 
E
D
 
D
A
 
A
N
 
Q
G
 
G
L
 
K
K
 
K
F
 
F
R
|
R
V
 
I
Q
 
M
S
 
A
S
 
S
D
 
D
V
 
V
L
 
L
V
 
A
A
 
A
Q
 
Q
M
 
F
E
 
Q
A
 
A
I
 
V
G
 
E
G
 
A
S
 
I
P
 
P
Q
 
V
K
 
K
M
 
K
A
 
P
F
 
F
S
 
S
E
 
E
V
 
V
Y
 
F
G
 
T
A
 
L
L
 
L
Q
 
Q
Q
 
T
G
 
R
V
 
A
V
 
I
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
T
W
 
W
S
 
S
N
|
N
I
 
I
Y
 
Y
G
 
S
K
 
K
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
S
G
 
N
V
 
I
T
 
T
E
 
E
T
 
S
N
 
N
H
 
H
G
 
G
A
 
V
L
 
L
D
 
D
Y
|
Y
L
 
M
V
 
V
V
 
V
T
 
T
S
 
S
V
 
N
D
 
T
W
 
F
L
 
W
D
 
K
S
 
S
L
 
L
D
 
P
P
 
A
A
 
D
V
 
K
R
 
R
E
 
K
Q
 
V
F
 
I
L
 
K
T
 
A
I
 
S
L
 
L
G
 
D
E
 
E
V
 
A
T
 
I
A
 
A
T
 
Y
R
 
G
N
 
N
S
 
E
-
 
I
E
 
A
S
 
A
T
 
A
K
 
K
V
 
V
N
 
N
A
 
K
E
 
D
A
 
-
R
 
K
Q
 
Q
S
 
A
I
 
I
I
 
I
D
 
D
A
 
S
G
 
K
-
 
R
G
 
S
V
 
E
V
 
V
R
 
T
E
 
Y
L
 
L
T
 
T
P
 
P
E
 
E
Q
 
Q
R
 
R
A
 
A
A
 
A
W
 
W
V
 
V
E
 
N
A
 
A
M
 
M
K
 
K
P
 
P
V
 
V
W
 
W
E
 
A
Q
 
Q
F
 
F
A
 
E
G
 
D
D
 
K
V
 
I
G
 
G
Q
 
K
D
 
D
M
 
L
I
 
I
D
 
D
A
 
A
A
 
A
Q
 
V
A
 
A
I
 
S
N
 
N

Q0B2F6 Solute-binding protein Bamb_6123 from Burkholderia ambifaria (strain ATCC BAA-244 / AMMD) (Burkholderia cepacia (strain AMMD)) (see paper)
28% identity, 92% coverage: 9:314/333 of query aligns to 10:311/328 of Q0B2F6

query
sites
Q0B2F6
T
 
T
A
 
A
V
 
L
A
 
A
L
 
V
T
 
A
M
 
L
S
 
M
A
 
A
G
 
G
T
 
F
A
 
A
M
 
M
A
 
S
A
 
A
C
 
-
D
 
-
D
 
-
G
 
-
E
 
Q
I
 
A
V
 
R
V
 
V
K
 
F
F
 
R
S
 
S
H
 
A
V
 
D
T
 
V
N
x
H
T
 
G
D
 
D
K
 
S
H
 
F
P
 
P
K
 
T
G
 
N
I
 
M
A
 
A
A
 
V
S
 
K
L
 
F
L
 
M
E
 
G
K
 
D
R
 
E
I
 
L
N
 
S
E
 
K
E
 
L
M
 
T
N
 
G
G
 
G
T
 
K
M
 
D
C
 
S
L
 
I
E
 
K
V
 
V
Y
 
F
P
 
G
N
 
N
S
 
S
T
 
A
L
 
L
Y
 
G
N
 
S
D
x
E
N
 
K
K
 
D
V
 
T
L
 
V
E
 
D
A
 
Q
M
 
V
L
 
R
Q
 
I
G
 
G
D
 
A
V
 
I
Q
 
D
L
 
M
A
 
A
A
x
R
P
 
V
S
 
N
L
 
G
S
 
A
K
 
S
F
 
F
E
 
N
K
 
E
F
 
I
T
 
V
K
 
P
Q
 
E
F
 
S
R
 
L
L
 
I
F
 
P
D
 
S
L
 
F
P
 
P
F
 
F
M
 
L
F
 
F
K
 
R
N
 
D
I
 
V
D
 
D
A
 
H
V
 
F
D
 
R
A
 
K
F
 
A
Q
 
M
G
 
Y
S
 
G
E
 
P
N
 
A
G
 
G
Q
 
Q
A
 
K
M
 
I
L
 
L
D
 
D
S
 
A
M
 
F
Q
 
A
R
 
A
R
 
K
G
 
G
L
 
M
Q
 
I
G
 
A
L
 
L
S
 
T
Y
 
F
W
 
Y
H
 
E
N
 
S
G
 
G
M
 
A
K
x
R
Q
 
S
M
 
I
S
 
Y
A
 
A
N
 
K
K
 
R
P
 
P
L
 
V
I
 
R
N
 
T
P
 
P
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
V
R
 
R
V
 
V
Q
 
Q
S
 
P
S
 
S
D
 
D
V
 
L
L
 
M
V
 
V
A
 
D
Q
 
E
M
 
I
E
 
R
A
 
A
I
 
M
G
 
G
G
 
G
S
 
T
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
P
F
 
F
S
 
A
E
 
E
V
 
V
Y
 
Y
G
 
T
A
 
G
L
 
L
Q
 
K
Q
 
T
G
 
G
V
 
L
V
 
V
D
 
D
G
 
A
Q
 
A
E
 
E
N
|
N
T
 
N
W
 
L
S
 
P
N
 
S
I
 
Y
Y
 
E
G
 
E
K
 
T
K
 
K
F
 
H
F
 
F
E
 
E
V
 
V
Q
 
A
D
 
P
G
 
D
V
 
Y
T
 
S
E
 
E
T
 
T
N
 
Q
H
 
H
G
 
A
A
 
M
L
 
T
D
 
P
Y
x
E
L
 
V
V
 
L
V
 
V
T
 
F
S
 
S
V
 
K
D
 
K
W
 
I
L
 
W
D
 
D
S
 
T
L
 
L
D
 
S
P
 
P
A
 
Q
V
 
E
R
 
Q
E
 
A
Q
 
A
F
 
I
L
 
R
T
 
K
I
 
A
L
 
A
G
 
A
E
 
D
V
 
S
T
 
V
A
 
P
T
 
Y
R
 
Y
N
 
Q
S
 
K
E
 
L
S
 
W
T
 
T
K
 
A
V
 
R
N
 
E
A
 
A
E
 
S
A
 
A
R
 
Q
Q
 
Q
S
 
A
I
 
V
I
 
T
D
 
K
A
 
G
G
 
G
G
 
A
V
 
N
V
 
I
R
 
L
E
 
P
L
 
A
T
 
A
P
 
Q
E
 
V
Q
 
D
R
 
R
A
 
A
A
 
A
W
 
F
V
 
V
E
 
K
A
 
A
M
 
M
K
 
Q
P
 
P
V
 
L
W
 
W
E
 
T
Q
 
K
F
 
Y

4n17A Crystal structure of a trap periplasmic solute binding protein from burkholderia ambifaria (bam_6123), target efi-510059, with bound beta-d-galacturonate (see paper)
27% identity, 83% coverage: 40:314/333 of query aligns to 11:285/301 of 4n17A

query
sites
4n17A
D
 
D
K
 
S
H
 
F
P
 
P
K
 
T
G
 
N
I
 
M
A
 
A
A
 
V
S
 
K
L
 
F
L
 
M
E
 
G
K
 
D
R
 
E
I
 
L
N
 
S
E
 
K
E
 
L
M
 
T
N
 
G
G
 
G
T
 
K
M
 
D
C
 
S
L
 
I
E
 
K
V
 
V
Y
 
F
P
 
G
N
 
N
S
 
S
T
 
A
L
 
L
Y
 
G
N
 
S
D
x
E
N
 
K
K
 
D
V
 
T
L
 
V
E
 
D
A
 
Q
M
 
V
L
 
R
Q
 
I
G
 
G
D
 
A
V
 
I
Q
 
D
L
 
M
A
 
A
A
x
R
P
 
V
S
x
N
L
 
G
S
 
A
K
 
S
F
 
F
E
 
N
K
 
E
F
 
I
T
 
V
K
 
P
Q
 
E
F
 
S
R
 
L
L
 
I
F
 
P
D
 
S
L
 
F
P
 
P
F
 
F
M
 
L
F
 
F
K
 
R
N
 
D
I
 
V
D
 
D
A
 
H
V
 
F
D
 
R
A
 
K
F
 
A
Q
 
M
G
 
Y
S
 
G
E
 
P
N
 
A
G
 
G
Q
 
Q
A
 
K
M
 
I
L
 
L
D
 
D
S
 
A
M
 
F
Q
 
A
R
 
A
R
 
K
G
 
G
L
 
M
Q
 
I
G
 
A
L
 
L
S
 
T
Y
 
F
W
 
Y
H
 
E
N
 
S
G
 
G
M
 
A
K
x
R
Q
 
S
M
 
I
S
 
Y
A
 
A
N
 
K
K
 
R
P
 
P
L
 
V
I
 
R
N
 
T
P
 
P
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
V
R
|
R
V
 
V
Q
|
Q
S
 
P
S
 
S
D
 
D
V
 
L
L
 
M
V
 
V
A
 
D
Q
 
E
M
 
I
E
 
R
A
 
A
I
 
M
G
 
G
G
 
G
S
 
T
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
P
F
|
F
S
 
A
E
 
E
V
 
V
Y
 
Y
G
 
T
A
 
G
L
 
L
Q
 
K
Q
 
T
G
 
G
V
 
L
V
 
V
D
 
D
G
 
A
Q
 
A
E
 
E
N
|
N
T
 
N
W
 
L
S
 
P
N
 
S
I
 
Y
Y
 
E
G
 
E
K
 
T
K
 
K
F
 
H
F
 
F
E
 
E
V
 
V
Q
 
A
D
 
P
G
 
D
V
 
Y
T
 
S
E
 
E
T
 
T
N
 
Q
H
 
H
G
 
A
A
 
M
L
 
T
D
 
P
Y
x
E
L
 
V
V
 
L
V
 
V
T
 
F
S
 
S
V
 
K
D
 
K
W
 
I
L
 
W
D
 
D
S
 
T
L
 
L
D
 
S
P
 
P
A
 
Q
V
 
E
R
 
Q
E
 
A
Q
 
A
F
 
I
L
 
R
T
 
K
I
 
A
L
 
A
G
 
A
E
 
D
V
 
S
T
 
V
A
 
P
T
 
Y
R
 
Y
N
 
Q
S
 
K
E
 
L
S
 
W
T
 
T
K
 
A
V
 
R
N
 
E
A
 
A
E
 
S
A
 
A
R
 
Q
Q
 
Q
S
 
A
I
 
V
I
 
T
D
 
K
A
 
G
G
 
G
G
 
A
V
 
N
V
 
I
R
 
L
E
 
P
L
 
A
T
 
A
P
 
Q
E
 
V
Q
 
D
R
 
R
A
 
A
A
 
A
W
 
F
V
 
V
E
 
K
A
 
A
M
 
M
K
 
Q
P
 
P
V
 
L
W
 
W
E
 
T
Q
 
K
F
 
Y

Sites not aligning to the query:

4n15A Crystal structure of a trap periplasmic solute binding protein from burkholderia ambifaria (bam_6123), target efi-510059, with bound beta-d-glucuronate (see paper)
27% identity, 83% coverage: 40:314/333 of query aligns to 11:285/301 of 4n15A

query
sites
4n15A
D
 
D
K
 
S
H
 
F
P
 
P
K
 
T
G
 
N
I
 
M
A
 
A
A
 
V
S
 
K
L
 
F
L
 
M
E
 
G
K
 
D
R
 
E
I
 
L
N
 
S
E
 
K
E
 
L
M
 
T
N
 
G
G
 
G
T
 
K
M
 
D
C
 
S
L
 
I
E
 
K
V
 
V
Y
 
F
P
 
G
N
 
N
S
 
S
T
 
A
L
 
L
Y
 
G
N
 
S
D
x
E
N
 
K
K
 
D
V
 
T
L
 
V
E
 
D
A
 
Q
M
 
V
L
 
R
Q
 
I
G
 
G
D
 
A
V
 
I
Q
 
D
L
 
M
A
 
A
A
x
R
P
 
V
S
x
N
L
 
G
S
 
A
K
 
S
F
 
F
E
 
N
K
 
E
F
 
I
T
 
V
K
 
P
Q
 
E
F
 
S
R
 
L
L
 
I
F
 
P
D
 
S
L
 
F
P
 
P
F
 
F
M
 
L
F
 
F
K
 
R
N
 
D
I
 
V
D
 
D
A
 
H
V
 
F
D
 
R
A
 
K
F
 
A
Q
 
M
G
 
Y
S
 
G
E
 
P
N
 
A
G
 
G
Q
 
Q
A
 
K
M
 
I
L
 
L
D
 
D
S
 
A
M
 
F
Q
 
A
R
 
A
R
 
K
G
 
G
L
 
M
Q
 
I
G
 
A
L
 
L
S
 
T
Y
 
F
W
 
Y
H
 
E
N
 
S
G
 
G
M
 
A
K
x
R
Q
 
S
M
 
I
S
 
Y
A
 
A
N
 
K
K
 
R
P
 
P
L
 
V
I
 
R
N
 
T
P
 
P
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
V
R
|
R
V
 
V
Q
|
Q
S
 
P
S
 
S
D
 
D
V
 
L
L
 
M
V
 
V
A
 
D
Q
 
E
M
 
I
E
 
R
A
 
A
I
 
M
G
 
G
G
 
G
S
 
T
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
P
F
|
F
S
 
A
E
 
E
V
 
V
Y
 
Y
G
 
T
A
 
G
L
 
L
Q
 
K
Q
 
T
G
 
G
V
 
L
V
 
V
D
 
D
G
 
A
Q
 
A
E
 
E
N
|
N
T
 
N
W
 
L
S
 
P
N
 
S
I
 
Y
Y
 
E
G
 
E
K
 
T
K
 
K
F
 
H
F
 
F
E
 
E
V
 
V
Q
 
A
D
 
P
G
 
D
V
 
Y
T
 
S
E
 
E
T
 
T
N
 
Q
H
 
H
G
 
A
A
 
M
L
 
T
D
 
P
Y
x
E
L
 
V
V
 
L
V
 
V
T
 
F
S
 
S
V
 
K
D
 
K
W
 
I
L
 
W
D
 
D
S
 
T
L
 
L
D
 
S
P
 
P
A
 
Q
V
 
E
R
 
Q
E
 
A
Q
 
A
F
 
I
L
 
R
T
 
K
I
 
A
L
 
A
G
 
A
E
 
D
V
 
S
T
 
V
A
 
P
T
 
Y
R
 
Y
N
 
Q
S
 
K
E
 
L
S
 
W
T
 
T
K
 
A
V
 
R
N
 
E
A
 
A
E
 
S
A
 
A
R
 
Q
Q
 
Q
S
 
A
I
 
V
I
 
T
D
 
K
A
 
G
G
 
G
G
 
A
V
 
N
V
 
I
R
 
L
E
 
P
L
 
A
T
 
A
P
 
Q
E
 
V
Q
 
D
R
 
R
A
 
A
A
 
A
W
 
F
V
 
V
E
 
K
A
 
A
M
 
M
K
 
Q
P
 
P
V
 
L
W
 
W
E
 
T
Q
 
K
F
 
Y

Sites not aligning to the query:

7bcrA Crystal structure of the sugar acid binding protein dctpam from advenella mimigardefordensis strain dpn7t in complex with galactonate (see paper)
26% identity, 89% coverage: 30:324/333 of query aligns to 6:300/310 of 7bcrA

query
sites
7bcrA
V
 
I
V
 
I
K
 
R
F
 
F
S
 
G
H
 
Y
V
x
G
T
x
L
N
 
-
T
 
A
D
 
D
K
 
D
H
 
S
P
 
P
K
 
T
G
 
G
I
 
K
A
 
A
A
 
S
S
 
A
L
 
H
L
 
F
E
 
A
K
 
E
R
 
V
I
 
V
N
 
S
E
 
K
E
 
L
M
 
S
N
 
D
G
 
G
T
 
K
M
 
M
C
 
K
L
 
V
E
 
K
V
 
T
Y
 
F
P
 
G
N
 
N
S
 
G
T
 
A
L
 
L
Y
 
G
N
 
P
D
|
D
N
 
E
K
 
Q
V
 
L
L
 
I
E
 
N
A
 
S
M
 
L
L
 
I
Q
 
S
G
 
G
D
 
S
V
 
G
Q
 
E
L
 
I
A
 
T
A
 
F
P
 
V
S
|
S
L
 
T
S
 
A
K
 
P
F
 
I
E
 
A
K
 
S
F
 
L
T
 
I
K
 
P
Q
 
E
F
 
F
R
 
G
L
 
V
F
 
F
D
 
D
L
 
L
P
 
P
F
 
F
M
 
L
F
 
F
K
 
D
N
 
N
I
 
E
D
 
K
A
 
V
V
 
A
D
 
D
A
 
T
F
 
V
Q
 
L
G
 
D
S
 
G
E
 
P
N
 
E
G
 
G
Q
 
K
A
 
K
M
 
L
L
 
L
D
 
D
S
 
K
M
 
L
Q
 
P
R
 
A
R
 
K
G
 
G
L
 
L
Q
 
I
G
 
G
L
 
L
S
 
N
Y
 
Y
W
 
W
H
 
E
N
|
N
G
 
G
M
 
F
K
x
R
Q
 
N
M
 
I
S
 
T
A
 
N
N
 
S
K
 
R
P
 
H
L
 
E
I
 
I
N
 
S
P
 
K
-
 
L
S
 
D
D
 
D
A
 
I
N
 
G
G
 
G
L
 
I
K
 
K
F
 
L
R
|
R
V
 
V
Q
x
M
S
 
Q
S
 
N
D
 
Q
V
 
V
L
 
A
V
 
L
A
 
S
Q
 
V
M
 
F
E
 
K
A
 
G
I
 
L
G
 
G
G
 
A
S
 
N
P
 
A
Q
 
I
K
 
P
M
 
M
A
 
P
F
|
F
S
 
T
E
 
E
V
 
L
Y
 
F
G
 
T
A
 
A
L
 
L
Q
 
E
Q
 
T
G
 
K
V
 
T
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
S
N
 
T
I
 
I
Y
 
Q
G
 
T
K
 
S
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
P
G
 
Y
V
 
L
T
 
T
E
 
L
T
 
S
N
 
N
H
 
H
G
 
V
A
 
Y
L
 
T
D
 
P
Y
x
F
L
 
V
V
 
F
V
 
L
T
 
A
S
 
S
V
 
K
D
 
K
W
 
W
L
 
F
D
 
D
S
 
Q
L
 
L
D
 
S
P
 
Q
A
 
D
V
 
E
R
 
K
E
 
D
Q
 
V
F
 
I
L
 
T
T
 
Q
I
 
A
L
 
A
G
 
A
E
 
D
V
 
S
T
 
Q
A
 
A
T
 
F
R
 
Q
N
 
R
S
 
K
E
 
A
S
 
S
T
 
R
K
 
Q
V
 
G
N
 
N
A
 
E
E
 
D
A
 
A
R
 
L
Q
 
K
S
 
Y
I
 
L
I
 
K
D
 
E
A
 
H
G
 
N
G
 
V
V
 
K
V
 
V
R
 
A
E
 
E
L
 
F
T
 
S
P
 
T
E
 
E
Q
 
E
R
 
R
A
 
E
A
 
K
W
 
I
V
 
R
E
 
E
A
 
K
M
 
V
K
 
A
P
 
P
V
 
I
W
 
V
E
 
E
Q
 
S
F
 
L
A
 
K
G
 
A
D
 
K
V
 
I
G
 
G
Q
 
K
D
 
E
M
 
T
I
 
V
D
 
E

7bcpA Crystal structure of the sugar acid binding protein dctpam from advenella mimigardefordensis strain dpn7t in complex with gluconate (see paper)
26% identity, 89% coverage: 30:324/333 of query aligns to 6:300/310 of 7bcpA

query
sites
7bcpA
V
 
I
V
 
I
K
 
R
F
 
F
S
 
G
H
 
Y
V
x
G
T
x
L
N
 
-
T
 
A
D
 
D
K
 
D
H
 
S
P
 
P
K
 
T
G
 
G
I
 
K
A
 
A
A
 
S
S
 
A
L
 
H
L
 
F
E
 
A
K
 
E
R
 
V
I
 
V
N
 
S
E
 
K
E
 
L
M
 
S
N
 
D
G
 
G
T
 
K
M
 
M
C
 
K
L
 
V
E
 
K
V
 
T
Y
 
F
P
 
G
N
 
N
S
 
G
T
 
A
L
 
L
Y
 
G
N
 
P
D
|
D
N
 
E
K
 
Q
V
 
L
L
 
I
E
 
N
A
 
S
M
 
L
L
 
I
Q
 
S
G
 
G
D
 
S
V
 
G
Q
 
E
L
 
I
A
 
T
A
x
F
P
 
V
S
|
S
L
 
T
S
 
A
K
 
P
F
 
I
E
 
A
K
 
S
F
 
L
T
 
I
K
 
P
Q
 
E
F
 
F
R
 
G
L
 
V
F
 
F
D
 
D
L
 
L
P
 
P
F
 
F
M
 
L
F
 
F
K
 
D
N
 
N
I
 
E
D
 
K
A
 
V
V
 
A
D
 
D
A
 
T
F
 
V
Q
 
L
G
 
D
S
 
G
E
 
P
N
 
E
G
 
G
Q
 
K
A
 
K
M
 
L
L
 
L
D
 
D
S
 
K
M
 
L
Q
 
P
R
 
A
R
 
K
G
 
G
L
 
L
Q
 
I
G
 
G
L
 
L
S
 
N
Y
 
Y
W
 
W
H
 
E
N
|
N
G
 
G
M
 
F
K
x
R
Q
 
N
M
 
I
S
 
T
A
 
N
N
 
S
K
 
R
P
 
H
L
 
E
I
 
I
N
 
S
P
 
K
-
 
L
S
 
D
D
 
D
A
 
I
N
 
G
G
 
G
L
 
I
K
 
K
F
 
L
R
|
R
V
 
V
Q
x
M
S
 
Q
S
 
N
D
 
Q
V
 
V
L
 
A
V
 
L
A
 
S
Q
 
V
M
 
F
E
 
K
A
 
G
I
 
L
G
 
G
G
 
A
S
 
N
P
 
A
Q
 
I
K
 
P
M
 
M
A
 
P
F
|
F
S
 
T
E
 
E
V
 
L
Y
 
F
G
 
T
A
 
A
L
 
L
Q
 
E
Q
 
T
G
 
K
V
 
T
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
S
N
 
T
I
 
I
Y
 
Q
G
 
T
K
 
S
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
P
G
 
Y
V
 
L
T
 
T
E
 
L
T
 
S
N
 
N
H
 
H
G
 
V
A
 
Y
L
 
T
D
 
P
Y
x
F
L
 
V
V
 
F
V
 
L
T
 
A
S
 
S
V
 
K
D
 
K
W
 
W
L
 
F
D
 
D
S
 
Q
L
 
L
D
 
S
P
 
Q
A
 
D
V
 
E
R
 
K
E
 
D
Q
 
V
F
 
I
L
 
T
T
 
Q
I
 
A
L
 
A
G
 
A
E
 
D
V
 
S
T
 
Q
A
 
A
T
 
F
R
 
Q
N
 
R
S
 
K
E
 
A
S
 
S
T
 
R
K
 
Q
V
 
G
N
 
N
A
 
E
E
 
D
A
 
A
R
 
L
Q
 
K
S
 
Y
I
 
L
I
 
K
D
 
E
A
 
H
G
 
N
G
 
V
V
 
K
V
 
V
R
 
A
E
 
E
L
 
F
T
 
S
P
 
T
E
 
E
Q
 
E
R
 
R
A
 
E
A
 
K
W
 
I
V
 
R
E
 
E
A
 
K
M
 
V
K
 
A
P
 
P
V
 
I
W
 
V
E
 
E
Q
 
S
F
 
L
A
 
K
G
 
A
D
 
K
V
 
I
G
 
G
Q
 
K
D
 
E
M
 
T
I
 
V
D
 
E

7bcoA Crystal structure of the sugar acid binding protein dctpam from advenella mimigardefordensis strain dpn7t in complex with d-foconate (see paper)
26% identity, 89% coverage: 30:324/333 of query aligns to 6:300/310 of 7bcoA

query
sites
7bcoA
V
 
I
V
 
I
K
 
R
F
 
F
S
 
G
H
 
Y
V
 
G
T
x
L
N
 
-
T
 
A
D
 
D
K
 
D
H
 
S
P
 
P
K
 
T
G
 
G
I
 
K
A
 
A
A
 
S
S
 
A
L
 
H
L
 
F
E
 
A
K
 
E
R
 
V
I
 
V
N
 
S
E
 
K
E
 
L
M
 
S
N
 
D
G
 
G
T
 
K
M
 
M
C
 
K
L
 
V
E
 
K
V
 
T
Y
 
F
P
 
G
N
 
N
S
 
G
T
 
A
L
 
L
Y
 
G
N
 
P
D
|
D
N
 
E
K
 
Q
V
 
L
L
 
I
E
 
N
A
 
S
M
 
L
L
 
I
Q
 
S
G
 
G
D
 
S
V
 
G
Q
 
E
L
 
I
A
 
T
A
 
F
P
 
V
S
|
S
L
 
T
S
 
A
K
 
P
F
 
I
E
 
A
K
 
S
F
 
L
T
 
I
K
 
P
Q
 
E
F
 
F
R
 
G
L
 
V
F
 
F
D
 
D
L
 
L
P
 
P
F
 
F
M
 
L
F
 
F
K
 
D
N
 
N
I
 
E
D
 
K
A
 
V
V
 
A
D
 
D
A
 
T
F
 
V
Q
 
L
G
 
D
S
 
G
E
 
P
N
 
E
G
 
G
Q
 
K
A
 
K
M
 
L
L
 
L
D
 
D
S
 
K
M
 
L
Q
 
P
R
 
A
R
 
K
G
 
G
L
 
L
Q
 
I
G
 
G
L
 
L
S
 
N
Y
 
Y
W
 
W
H
 
E
N
|
N
G
 
G
M
 
F
K
x
R
Q
 
N
M
 
I
S
 
T
A
 
N
N
 
S
K
 
R
P
 
H
L
 
E
I
 
I
N
 
S
P
 
K
-
 
L
S
 
D
D
 
D
A
 
I
N
 
G
G
 
G
L
 
I
K
 
K
F
 
L
R
|
R
V
 
V
Q
x
M
S
 
Q
S
 
N
D
 
Q
V
 
V
L
 
A
V
 
L
A
 
S
Q
 
V
M
 
F
E
 
K
A
 
G
I
 
L
G
 
G
G
 
A
S
 
N
P
 
A
Q
 
I
K
 
P
M
 
M
A
 
P
F
|
F
S
 
T
E
 
E
V
 
L
Y
 
F
G
 
T
A
 
A
L
 
L
Q
 
E
Q
 
T
G
 
K
V
 
T
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
S
N
 
T
I
 
I
Y
 
Q
G
 
T
K
 
S
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
P
G
 
Y
V
 
L
T
 
T
E
 
L
T
 
S
N
 
N
H
 
H
G
 
V
A
 
Y
L
 
T
D
 
P
Y
 
F
L
 
V
V
 
F
V
 
L
T
 
A
S
 
S
V
 
K
D
 
K
W
 
W
L
 
F
D
 
D
S
 
Q
L
 
L
D
 
S
P
 
Q
A
 
D
V
 
E
R
 
K
E
 
D
Q
 
V
F
 
I
L
 
T
T
 
Q
I
 
A
L
 
A
G
 
A
E
 
D
V
 
S
T
 
Q
A
 
A
T
 
F
R
 
Q
N
 
R
S
 
K
E
 
A
S
 
S
T
 
R
K
 
Q
V
 
G
N
 
N
A
 
E
E
 
D
A
 
A
R
 
L
Q
 
K
S
 
Y
I
 
L
I
 
K
D
 
E
A
 
H
G
 
N
G
 
V
V
 
K
V
 
V
R
 
A
E
 
E
L
 
F
T
 
S
P
 
T
E
 
E
Q
 
E
R
 
R
A
 
E
A
 
K
W
 
I
V
 
R
E
 
E
A
 
K
M
 
V
K
 
A
P
 
P
V
 
I
W
 
V
E
 
E
Q
 
S
F
 
L
A
 
K
G
 
A
D
 
K
V
 
I
G
 
G
Q
 
K
D
 
E
M
 
T
I
 
V
D
 
E

7bcnA Crystal structure of the sugar acid binding protein dctpam from advenella mimigardefordensis strain dpn7t in complex with xylonic acid (see paper)
26% identity, 89% coverage: 30:324/333 of query aligns to 6:300/310 of 7bcnA

query
sites
7bcnA
V
 
I
V
 
I
K
 
R
F
 
F
S
 
G
H
 
Y
V
 
G
T
 
L
N
 
-
T
 
A
D
 
D
K
 
D
H
 
S
P
 
P
K
 
T
G
 
G
I
 
K
A
 
A
A
 
S
S
 
A
L
 
H
L
 
F
E
 
A
K
 
E
R
 
V
I
 
V
N
 
S
E
 
K
E
 
L
M
 
S
N
 
D
G
 
G
T
 
K
M
 
M
C
 
K
L
 
V
E
 
K
V
 
T
Y
 
F
P
 
G
N
 
N
S
 
G
T
 
A
L
 
L
Y
 
G
N
 
P
D
|
D
N
 
E
K
 
Q
V
 
L
L
 
I
E
 
N
A
 
S
M
 
L
L
 
I
Q
 
S
G
 
G
D
 
S
V
 
G
Q
 
E
L
 
I
A
 
T
A
 
F
P
 
V
S
|
S
L
 
T
S
 
A
K
 
P
F
 
I
E
 
A
K
 
S
F
 
L
T
 
I
K
 
P
Q
 
E
F
 
F
R
 
G
L
 
V
F
 
F
D
 
D
L
 
L
P
 
P
F
 
F
M
 
L
F
 
F
K
 
D
N
 
N
I
 
E
D
 
K
A
 
V
V
 
A
D
 
D
A
 
T
F
 
V
Q
 
L
G
 
D
S
 
G
E
 
P
N
 
E
G
 
G
Q
 
K
A
 
K
M
 
L
L
 
L
D
 
D
S
 
K
M
 
L
Q
 
P
R
 
A
R
 
K
G
 
G
L
 
L
Q
 
I
G
 
G
L
 
L
S
 
N
Y
 
Y
W
 
W
H
 
E
N
|
N
G
 
G
M
 
F
K
x
R
Q
 
N
M
 
I
S
 
T
A
 
N
N
 
S
K
 
R
P
 
H
L
 
E
I
 
I
N
 
S
P
 
K
-
 
L
S
 
D
D
 
D
A
 
I
N
 
G
G
 
G
L
 
I
K
 
K
F
 
L
R
|
R
V
 
V
Q
x
M
S
 
Q
S
 
N
D
 
Q
V
 
V
L
 
A
V
 
L
A
 
S
Q
 
V
M
 
F
E
 
K
A
 
G
I
 
L
G
 
G
G
 
A
S
 
N
P
 
A
Q
 
I
K
 
P
M
 
M
A
 
P
F
|
F
S
 
T
E
 
E
V
 
L
Y
 
F
G
 
T
A
 
A
L
 
L
Q
 
E
Q
 
T
G
 
K
V
 
T
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
S
N
 
T
I
 
I
Y
 
Q
G
 
T
K
 
S
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
P
G
 
Y
V
 
L
T
 
T
E
 
L
T
 
S
N
 
N
H
 
H
G
 
V
A
 
Y
L
 
T
D
 
P
Y
x
F
L
 
V
V
 
F
V
 
L
T
 
A
S
 
S
V
 
K
D
 
K
W
 
W
L
 
F
D
 
D
S
 
Q
L
 
L
D
 
S
P
 
Q
A
 
D
V
 
E
R
 
K
E
 
D
Q
 
V
F
 
I
L
 
T
T
 
Q
I
 
A
L
 
A
G
 
A
E
 
D
V
 
S
T
 
Q
A
 
A
T
 
F
R
 
Q
N
 
R
S
 
K
E
 
A
S
 
S
T
 
R
K
 
Q
V
 
G
N
 
N
A
 
E
E
 
D
A
 
A
R
 
L
Q
 
K
S
 
Y
I
 
L
I
 
K
D
 
E
A
 
H
G
 
N
G
 
V
V
 
K
V
 
V
R
 
A
E
 
E
L
 
F
T
 
S
P
 
T
E
 
E
Q
 
E
R
 
R
A
 
E
A
 
K
W
 
I
V
 
R
E
 
E
A
 
K
M
 
V
K
 
A
P
 
P
V
 
I
W
 
V
E
 
E
Q
 
S
F
 
L
A
 
K
G
 
A
D
 
K
V
 
I
G
 
G
Q
 
K
D
 
E
M
 
T
I
 
V
D
 
E

7bbrA Crystal structure of the sugar acid binding protein dctpam from advenella mimigardefordensis strain dpn7t (see paper)
26% identity, 89% coverage: 30:324/333 of query aligns to 7:301/310 of 7bbrA

query
sites
7bbrA
V
 
I
V
 
I
K
 
R
F
 
F
S
 
G
H
 
Y
V
x
G
T
x
L
N
 
-
T
 
A
D
 
D
K
 
D
H
 
S
P
 
P
K
 
T
G
 
G
I
 
K
A
 
A
A
 
S
S
 
A
L
 
H
L
 
F
E
 
A
K
 
E
R
 
V
I
 
V
N
 
S
E
 
K
E
 
L
M
 
S
N
 
D
G
 
G
T
 
K
M
 
M
C
 
K
L
 
V
E
 
K
V
 
T
Y
 
F
P
 
G
N
 
N
S
 
G
T
 
A
L
 
L
Y
 
G
N
 
P
D
|
D
N
 
E
K
 
Q
V
 
L
L
 
I
E
 
N
A
 
S
M
 
L
L
 
I
Q
 
S
G
 
G
D
 
S
V
 
G
Q
 
E
L
 
I
A
 
T
A
 
F
P
 
V
S
|
S
L
 
T
S
 
A
K
 
P
F
 
I
E
 
A
K
 
S
F
 
L
T
 
I
K
 
P
Q
 
E
F
 
F
R
 
G
L
 
V
F
 
F
D
 
D
L
 
L
P
 
P
F
 
F
M
 
L
F
 
F
K
 
D
N
 
N
I
 
E
D
 
K
A
 
V
V
 
A
D
 
D
A
 
T
F
 
V
Q
 
L
G
 
D
S
 
G
E
 
P
N
 
E
G
 
G
Q
 
K
A
 
K
M
 
L
L
 
L
D
 
D
S
 
K
M
 
L
Q
 
P
R
 
A
R
 
K
G
 
G
L
 
L
Q
 
I
G
 
G
L
 
L
S
 
N
Y
 
Y
W
 
W
H
 
E
N
|
N
G
 
G
M
 
F
K
x
R
Q
 
N
M
 
I
S
 
T
A
 
N
N
 
S
K
 
R
P
 
H
L
 
E
I
 
I
N
 
S
P
 
K
-
 
L
S
 
D
D
 
D
A
 
I
N
 
G
G
 
G
L
 
I
K
 
K
F
 
L
R
|
R
V
 
V
Q
x
M
S
 
Q
S
 
N
D
 
Q
V
 
V
L
 
A
V
 
L
A
 
S
Q
 
V
M
 
F
E
 
K
A
 
G
I
 
L
G
 
G
G
 
A
S
 
N
P
 
A
Q
 
I
K
 
P
M
 
M
A
 
P
F
|
F
S
 
T
E
 
E
V
 
L
Y
 
F
G
 
T
A
 
A
L
 
L
Q
 
E
Q
 
T
G
 
K
V
 
T
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
S
N
 
T
I
 
I
Y
 
Q
G
 
T
K
 
S
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
P
G
 
Y
V
 
L
T
 
T
E
 
L
T
 
S
N
 
N
H
 
H
G
 
V
A
 
Y
L
 
T
D
 
P
Y
 
F
L
 
V
V
 
F
V
 
L
T
 
A
S
 
S
V
 
K
D
 
K
W
 
W
L
 
F
D
 
D
S
 
Q
L
 
L
D
 
S
P
 
Q
A
 
D
V
 
E
R
 
K
E
 
D
Q
 
V
F
 
I
L
 
T
T
 
Q
I
 
A
L
 
A
G
 
A
E
 
D
V
 
S
T
 
Q
A
 
A
T
 
F
R
 
Q
N
 
R
S
 
K
E
 
A
S
 
S
T
 
R
K
 
Q
V
 
G
N
 
N
A
 
E
E
 
D
A
 
A
R
 
L
Q
 
K
S
 
Y
I
 
L
I
 
K
D
 
E
A
 
H
G
 
N
G
 
V
V
 
K
V
 
V
R
 
A
E
 
E
L
 
F
T
 
S
P
 
T
E
 
E
Q
 
E
R
 
R
A
 
E
A
 
K
W
 
I
V
 
R
E
 
E
A
 
K
M
 
V
K
 
A
P
 
P
V
 
I
W
 
V
E
 
E
Q
 
S
F
 
L
A
 
K
G
 
A
D
 
K
V
 
I
G
 
G
Q
 
K
D
 
E
M
 
T
I
 
V
D
 
E

7t3eA Structure of the sialic acid bound tripartite atp-independent periplasmic (trap) periplasmic component siap from photobacterium profundum (see paper)
32% identity, 83% coverage: 47:324/333 of query aligns to 20:295/300 of 7t3eA

query
sites
7t3eA
A
 
S
A
 
A
S
 
K
L
 
I
L
 
L
E
 
S
K
 
D
R
 
K
I
 
I
N
 
S
E
 
E
E
 
L
M
 
S
N
 
D
G
 
G
T
 
E
M
 
M
C
 
K
L
 
L
E
 
L
V
 
L
Y
 
Y
P
 
P
N
 
G
S
 
A
T
 
Q
L
 
L
Y
 
G
N
 
D
D
|
D
N
 
R
K
 
A
V
 
M
L
 
L
E
 
Q
A
 
Q
M
 
L
L
 
S
Q
 
M
G
 
G
D
 
D
V
 
L
Q
 
D
L
 
I
A
 
T
A
x
F
P
 
A
S
x
E
L
 
F
S
 
G
K
x
R
F
 
M
E
 
G
K
 
L
F
 
W
T
 
I
K
 
P
Q
 
R
F
 
A
R
 
E
L
 
A
F
 
V
D
 
M
L
 
L
P
 
P
F
 
Y
M
 
V
F
 
V
K
 
K
N
 
N
I
 
Y
D
 
A
A
 
H
V
 
I
D
 
Q
A
 
R
F
 
I
Q
 
F
G
 
N
S
 
S
E
 
K
N
 
F
G
 
G
Q
 
Q
A
 
G
M
 
V
L
 
R
D
 
E
S
 
E
M
 
M
Q
 
L
R
 
T
R
 
N
-
 
F
G
 
N
L
 
W
Q
 
R
G
 
A
L
 
L
S
 
D
Y
 
T
W
 
W
H
 
Y
N
 
N
G
 
G
M
 
T
K
x
R
Q
 
Q
M
 
T
S
 
S
A
 
S
N
 
N
K
 
R
P
 
P
L
 
L
I
 
N
N
 
T
P
 
I
S
 
S
D
 
D
A
 
F
N
 
E
G
 
G
L
 
L
K
 
K
F
 
L
R
|
R
V
 
V
Q
 
P
S
 
N
S
 
A
D
 
K
V
 
A
L
 
N
V
 
L
A
 
A
Q
 
F
M
 
A
E
 
K
A
 
Y
I
 
A
G
 
G
G
 
A
S
 
S
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
V
F
|
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
P
N
 
T
I
 
F
Y
 
N
G
 
T
K
 
M
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
P
G
 
N
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
V
L
 
N
D
 
D
Y
 
Q
L
 
M
V
 
V
V
 
L
T
 
I
S
 
S
V
 
E
D
 
D
W
 
R
L
 
W
D
 
Q
S
 
S
L
 
L
D
 
S
P
 
-
A
 
-
V
 
-
R
 
K
E
 
D
Q
 
Q
F
 
Q
L
 
A
T
 
T
I
 
I
L
 
T
G
 
E
E
 
A
V
 
V
T
 
S
A
 
V
T
 
A
R
 
G
N
 
K
S
 
R
E
 
H
S
 
T
T
 
N
K
 
F
V
 
V
N
 
N
A
 
N
E
 
Q
A
 
E
R
 
K
Q
 
E
S
 
L
I
 
I
-
 
T
-
 
F
I
 
F
D
 
K
A
 
A
G
 
E
G
 
G
V
 
V
V
 
-
R
 
-
E
 
N
L
 
I
T
 
T
P
 
Y
E
 
P
Q
 
D
R
 
L
A
 
A
A
 
P
W
 
F
V
 
R
E
 
E
A
 
A
M
 
M
K
 
L
P
 
P
V
 
I
W
 
Y
E
 
K
Q
 
D
F
 
F
A
 
D
G
 
K
D
 
K
V
 
I
G
 
G
Q
 
K
D
 
Q
M
 
L
I
 
V
D
 
E

Sites not aligning to the query:

4x8rA Crystal structure of a trap periplasmic solute binding protein from rhodobacter sphaeroides (rsph17029_2138, target efi-510205) with bound glucuronate
27% identity, 84% coverage: 36:314/333 of query aligns to 6:287/304 of 4x8rA

query
sites
4x8rA
V
 
L
T
 
R
N
 
S
T
 
S
D
 
D
K
 
T
H
|
H
P
 
P
K
 
D
G
 
G
I
 
Y
-
 
P
-
 
T
-
 
V
-
 
E
A
 
G
A
 
V
S
 
K
L
 
F
L
 
M
E
 
A
K
 
E
R
 
R
I
 
A
N
 
K
E
 
E
E
 
L
M
 
S
N
 
N
G
 
G
T
 
R
M
 
I
C
 
C
L
 
I
E
 
E
V
 
V
Y
 
F
P
 
P
N
 
S
S
 
S
T
 
Q
L
 
L
Y
 
G
N
 
E
D
x
E
N
 
K
K
 
D
V
 
T
L
 
I
E
 
E
A
 
Q
M
 
T
L
 
Q
Q
 
F
G
 
G
D
 
V
V
 
I
Q
 
D
L
 
M
A
 
V
A
x
R
P
 
A
S
 
S
L
 
F
S
 
G
K
 
S
F
 
F
E
 
N
K
 
D
F
 
I
T
 
V
K
 
P
Q
 
E
F
 
A
R
 
Q
L
 
L
F
 
L
D
 
S
L
 
L
P
 
P
F
 
Y
M
 
L
F
 
F
K
 
R
N
 
S
I
 
E
D
 
E
A
 
H
V
 
L
D
 
H
A
x
N
F
 
V
Q
 
M
G
 
D
S
 
G
E
 
P
N
 
I
G
|
G
Q
 
D
A
 
E
M
 
L
L
 
A
D
 
K
S
 
A
M
 
F
Q
x
E
R
 
A
R
 
K
G
 
D
L
 
L
Q
 
I
G
 
A
L
 
V
S
 
A
Y
 
Y
W
 
Y
H
 
D
N
 
G
G
 
G
M
 
S
K
x
R
Q
 
S
M
 
F
-
 
Y
S
 
N
A
 
S
N
 
Q
K
 
K
P
 
P
L
 
I
I
 
T
N
 
K
P
 
V
S
 
E
D
 
D
A
 
L
N
 
K
G
 
G
L
 
M
K
 
K
F
 
F
R
|
R
V
 
V
Q
x
M
S
 
Q
S
 
S
D
 
D
V
 
V
L
 
F
V
 
V
A
 
D
Q
 
M
M
 
M
E
 
S
A
 
A
I
 
L
G
 
G
G
 
A
S
 
N
P
 
A
Q
 
T
K
 
P
M
 
M
A
 
P
F
x
Y
S
 
G
E
 
E
V
 
V
Y
 
Y
G
 
S
A
 
S
L
 
I
Q
 
Q
Q
 
T
G
 
G
V
 
V
V
 
I
D
 
D
G
 
G
Q
 
A
E
 
E
N
|
N
T
 
N
W
 
W
S
 
P
N
x
S
I
 
Y
Y
 
D
G
 
S
K
 
S
K
 
G
F
 
H
F
 
F
E
 
E
V
 
V
Q
 
A
D
 
K
G
 
Y
V
 
Y
T
 
T
E
 
L
T
 
D
N
 
Q
H
 
H
G
 
L
A
 
M
L
 
V
D
 
P
Y
x
E
L
|
L
V
 
V
-
 
A
V
 
I
T
 
S
S
 
K
V
 
I
D
 
K
W
 
W
L
 
-
D
 
D
S
 
A
L
 
L
D
 
S
P
 
P
A
 
E
V
 
D
R
 
Q
E
 
Q
Q
 
V
F
 
L
L
 
R
T
 
Q
I
 
A
L
 
A
G
 
E
E
 
E
V
 
S
T
 
E
A
 
P
T
 
V
R
 
Q
N
 
R
S
 
K
E
 
L
S
 
W
T
 
A
K
 
E
V
 
Q
N
 
E
A
 
K
E
 
A
A
 
S
R
 
E
Q
 
E
S
 
K
I
 
V
I
 
V
D
 
A
A
 
S
G
 
G
G
 
A
-
 
E
V
 
V
V
 
V
R
 
R
E
 
E
L
 
I
T
 
-
P
 
-
E
 
-
Q
 
D
R
 
K
A
 
T
A
 
P
W
 
F
V
 
I
E
 
E
A
 
A
M
 
M
K
 
A
P
 
P
V
 
V
W
 
Y
E
 
E
Q
 
K
F
 
Y

P44542 Sialic acid-binding periplasmic protein SiaP; Extracytoplasmic solute receptor protein SiaP; N-acetylneuraminic-binding protein; Neu5Ac-binding protein from Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) (see 2 papers)
29% identity, 97% coverage: 8:331/333 of query aligns to 10:326/329 of P44542

query
sites
P44542
A
 
A
T
 
T
A
 
A
V
 
I
A
 
S
L
 
L
T
 
G
M
 
V
S
 
S
A
 
S
G
 
A
T
 
V
A
 
L
M
 
A
A
 
A
A
 
D
C
 
Y
D
 
D
D
 
-
G
 
-
E
 
-
I
 
-
V
 
-
V
 
L
K
 
K
F
 
F
S
 
G
H
 
M
V
x
N
T
 
A
N
 
G
T
 
T
D
 
S
K
 
S
H
 
N
P
 
E
K
 
Y
G
 
K
I
 
-
A
 
A
A
 
A
S
 
E
L
 
M
L
 
F
E
 
A
K
 
K
R
 
E
I
 
V
N
 
K
E
 
E
E
 
K
M
 
S
N
 
Q
G
 
G
T
 
K
M
 
I
C
 
E
L
 
I
E
 
S
V
 
L
Y
 
Y
P
 
P
N
 
S
S
 
S
T
 
Q
L
 
L
Y
 
G
N
 
D
D
|
D
N
 
R
K
 
A
V
 
M
L
 
L
E
 
K
A
 
Q
M
 
L
L
 
K
Q
 
D
G
 
G
D
 
S
V
 
L
Q
 
D
L
 
F
A
x
T
A
 
F
P
 
A
S
x
E
L
 
S
S
 
A
K
 
R
F
 
F
E
 
Q
K
 
L
F
 
F
T
 
Y
K
 
P
Q
 
E
F
 
A
R
 
A
L
 
V
F
 
F
D
 
A
L
 
L
P
 
P
F
 
Y
M
 
V
F
 
I
K
 
S
N
 
N
I
 
Y
D
 
N
-
 
V
A
 
A
V
 
Q
D
 
K
A
 
A
F
 
L
Q
 
F
G
 
D
S
 
T
E
 
E
N
 
F
G
 
G
Q
 
K
A
 
D
M
 
L
L
 
I
D
 
K
S
 
K
M
 
M
Q
 
D
R
 
K
R
 
D
-
 
L
G
 
G
L
 
V
Q
 
T
G
 
L
L
 
L
S
 
S
Y
 
Q
W
 
A
H
 
Y
N
 
N
G
 
G
M
 
T
K
x
R
Q
 
Q
M
 
T
S
 
T
A
 
S
N
 
N
K
 
R
P
 
A
L
 
I
I
 
N
N
 
S
P
 
I
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
L
R
|
R
V
 
V
Q
 
P
S
 
N
S
 
A
D
 
A
V
 
T
L
 
N
V
 
L
A
 
A
Q
 
Y
M
 
A
E
 
K
A
 
Y
I
 
V
G
 
G
G
 
A
S
 
S
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
 
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
A
N
 
A
I
 
V
Y
 
Q
G
 
A
K
 
Q
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
K
G
 
F
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
L
L
 
N
D
 
D
Y
 
Q
L
 
L
V
 
Y
V
 
L
T
 
V
S
 
S
V
 
N
D
 
E
W
 
T
L
 
Y
D
 
K
S
 
E
L
 
L
D
 
P
P
 
-
A
 
-
V
 
-
R
 
-
E
 
E
Q
 
D
F
 
L
L
 
Q
T
 
K
I
 
V
L
 
V
G
 
K
E
 
D
V
 
A
T
 
A
A
 
E
T
 
N
R
 
A
N
 
A
S
 
K
E
 
Y
S
 
H
T
 
T
K
 
K
V
 
L
N
 
F
A
 
V
E
 
D
A
 
G
R
 
E
Q
 
K
S
 
D
I
 
L
I
 
V
-
 
T
-
 
F
-
 
F
D
 
E
A
 
K
G
 
Q
G
 
G
V
 
V
V
 
-
R
 
-
E
 
K
L
 
I
T
 
T
P
 
H
E
 
P
Q
 
D
R
 
L
A
 
V
A
 
P
W
 
F
V
 
K
E
 
E
A
 
S
M
 
M
K
 
K
P
 
P
V
 
Y
W
 
Y
E
 
A
Q
 
E
F
 
F
A
 
V
G
 
K
D
 
Q
V
 
T
G
 
G
Q
 
Q
D
 
K
M
 
G
I
 
E
D
 
S
A
 
A
A
 
L
Q
 
K
A
 
Q
I
 
I
N
 
E
A
 
A

4pddA Crystal structure of a trap periplasmic solute binding protein from polaromonas sp js666 (bpro_0088, target efi-510167) bound to d- erythronate (see paper)
28% identity, 91% coverage: 28:331/333 of query aligns to 1:302/303 of 4pddA

query
sites
4pddA
E
 
Q
I
 
T
V
 
I
V
 
L
K
 
K
F
 
I
S
 
G
H
 
Y
V
x
T
T
 
P
N
 
P
T
 
K
D
 
D
K
 
S
H
 
H
P
 
-
K
x
Y
G
 
G
I
 
V
A
 
G
A
 
A
S
 
T
L
 
T
L
 
F
E
 
C
K
 
D
R
 
E
I
 
V
N
 
E
E
 
K
E
 
G
M
 
T
N
 
Q
G
 
E
T
 
R
M
 
Y
C
 
K
L
 
C
E
 
Q
V
 
H
Y
 
F
P
 
P
N
 
S
S
 
S
T
 
A
L
 
L
Y
 
G
N
 
G
D
x
E
N
 
R
K
 
E
V
 
M
L
 
I
E
 
E
A
 
S
M
 
V
L
 
Q
Q
 
L
G
 
G
D
 
T
V
 
Q
Q
 
D
L
 
L
A
 
V
A
 
N
P
 
T
S
 
S
L
 
T
S
 
G
K
 
P
F
 
L
E
 
G
K
 
N
F
 
F
T
 
V
K
 
P
Q
 
E
F
 
T
R
 
R
L
 
I
F
 
V
D
 
D
L
 
I
P
 
P
F
 
F
M
 
L
F
 
F
K
 
R
N
 
D
I
 
Y
D
 
E
A
 
H
V
 
A
D
 
R
A
 
K
F
 
V
Q
 
M
G
 
D
S
 
G
E
 
A
N
 
I
G
 
G
Q
 
Q
A
 
D
M
 
L
L
 
L
D
 
K
S
 
K
M
 
M
Q
 
Q
R
 
A
R
 
K
G
 
G
L
 
L
Q
 
I
G
 
G
L
 
L
S
 
A
Y
 
W
W
 
T
H
 
E
N
|
N
G
 
G
M
 
F
K
x
R
Q
 
H
M
 
M
S
 
T
-
 
N
A
 
S
N
 
K
K
 
R
P
 
P
L
 
I
I
 
L
N
 
Q
P
 
A
S
 
S
D
 
D
A
 
A
N
 
A
G
 
G
L
 
L
K
 
K
F
 
V
R
|
R
V
 
T
Q
x
M
S
 
E
S
 
N
D
 
K
V
 
V
L
 
H
V
 
M
A
 
D
Q
 
G
M
 
Y
E
 
K
A
 
T
I
 
F
G
 
G
G
 
L
S
 
L
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
|
F
S
 
P
E
 
E
V
 
L
Y
 
F
G
 
T
A
 
A
L
 
L
Q
 
Q
Q
 
Q
G
 
G
V
 
T
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
I
S
 
P
N
 
V
I
 
I
Y
 
L
G
 
S
K
 
S
K
 
K
F
 
F
F
 
S
E
 
Q
V
 
V
Q
 
Q
D
 
K
G
 
H
V
 
L
T
 
S
E
 
L
T
 
T
N
 
G
H
 
H
G
 
V
A
 
Y
L
 
S
D
 
P
Y
 
A
L
 
V
V
 
L
V
 
I
T
 
L
S
 
S
V
 
S
D
 
R
W
 
V
L
 
W
D
 
D
S
 
K
L
 
L
D
 
S
P
 
E
A
 
A
V
 
D
R
 
K
E
 
K
Q
 
V
F
 
F
L
 
V
T
 
A
I
 
A
L
 
A
G
 
Q
E
 
K
V
 
A
T
 
T
A
 
V
T
 
-
R
 
-
N
 
-
S
 
A
E
 
Q
S
 
R
T
 
K
K
 
R
V
 
V
N
 
N
A
 
D
E
 
D
A
 
E
R
 
A
Q
 
N
S
 
G
I
 
I
I
 
T
-
 
Q
-
 
L
-
 
K
-
 
K
D
 
D
A
 
G
G
 
M
G
 
Q
V
 
V
V
 
V
R
 
E
E
 
K
L
 
V
T
 
D
P
 
G
E
 
E
Q
 
-
R
 
-
A
 
-
A
 
S
W
 
F
V
 
R
E
 
K
A
 
A
M
 
V
K
 
A
P
 
P
V
 
A
W
 
Y
E
 
A
Q
 
G
F
 
F
A
 
A
G
 
K
D
 
E
V
 
F
G
 
G
Q
 
A
D
 
E
M
 
R
I
 
I
D
 
A
A
 
A
A
 
I
Q
 
Q
A
 
A
I
 
V
N
 
K
A
 
A

3b50A Structure of h. Influenzae sialic acid binding protein bound to neu5ac. (see paper)
29% identity, 86% coverage: 47:331/333 of query aligns to 20:303/310 of 3b50A

query
sites
3b50A
A
 
A
A
 
A
S
 
E
L
 
M
L
 
F
E
 
A
K
 
K
R
 
E
I
 
V
N
 
K
E
 
E
E
 
K
M
 
S
N
 
Q
G
 
G
T
 
K
M
 
I
C
 
E
L
 
I
E
 
S
V
 
L
Y
 
Y
P
 
P
N
 
S
S
 
S
T
 
Q
L
 
L
Y
 
G
N
 
D
D
|
D
N
 
R
K
 
A
V
 
M
L
 
L
E
 
K
A
 
Q
M
 
L
L
 
K
Q
 
D
G
 
G
D
 
S
V
 
L
Q
 
D
L
 
F
A
 
T
A
x
F
P
 
A
S
x
E
L
 
S
S
 
A
K
x
R
F
 
F
E
 
Q
K
 
L
F
 
F
T
 
Y
K
 
P
Q
 
E
F
 
A
R
 
A
L
 
V
F
 
F
D
 
A
L
 
L
P
 
P
F
 
Y
M
 
V
F
 
I
K
 
S
N
 
N
I
 
Y
D
 
N
-
 
V
A
 
A
V
 
Q
D
 
K
A
 
A
F
 
L
Q
 
F
G
 
D
S
 
T
E
 
E
N
 
F
G
 
G
Q
 
K
A
 
D
M
 
L
L
 
I
D
 
K
S
 
K
M
 
M
Q
 
D
R
 
K
R
 
D
-
 
L
G
 
G
L
 
V
Q
 
T
G
 
L
L
 
L
S
 
S
Y
 
Q
W
 
A
H
 
Y
N
 
N
G
 
G
M
 
T
K
x
R
Q
 
Q
M
 
T
S
 
T
A
 
S
N
 
N
K
 
R
P
 
A
L
 
I
I
 
N
N
 
S
P
 
I
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
L
R
|
R
V
 
V
Q
 
P
S
 
N
S
 
A
D
 
A
V
 
T
L
 
N
V
 
L
A
 
A
Q
 
Y
M
 
A
E
 
K
A
 
Y
I
 
V
G
 
G
G
 
A
S
 
S
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
|
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
A
N
 
A
I
 
V
Y
 
Q
G
 
A
K
 
Q
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
K
G
 
F
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
L
L
 
N
D
 
D
Y
x
Q
L
 
L
V
 
Y
V
 
L
T
 
V
S
 
S
V
 
N
D
 
E
W
 
T
L
 
Y
D
 
K
S
 
E
L
 
L
D
 
P
P
 
-
A
 
-
V
 
-
R
 
-
E
 
E
Q
 
D
F
 
L
L
 
Q
T
 
K
I
 
V
L
 
V
G
 
K
E
 
D
V
 
A
T
 
A
A
 
E
T
 
N
R
 
A
N
 
A
S
 
K
E
 
Y
S
 
H
T
 
T
K
 
K
V
 
L
N
 
F
A
 
V
E
 
D
A
 
G
R
 
E
Q
 
K
S
 
D
I
 
L
I
 
V
-
 
T
-
 
F
-
 
F
D
 
E
A
 
K
G
 
Q
G
 
G
V
 
V
V
 
-
R
 
-
E
 
K
L
 
I
T
 
T
P
 
H
E
 
P
Q
 
D
R
 
L
A
 
V
A
 
P
W
 
F
V
 
K
E
 
E
A
 
S
M
 
M
K
 
K
P
 
P
V
 
Y
W
 
Y
E
 
A
Q
 
E
F
 
F
A
 
V
G
 
K
D
 
Q
V
 
T
G
 
G
Q
 
Q
D
 
K
M
 
G
I
 
E
D
 
S
A
 
A
A
 
L
Q
 
K
A
 
Q
I
 
I
N
 
E
A
 
A

Sites not aligning to the query:

2v4cA Structure of sialic acid binding protein (siap) in the presence of kdn (see paper)
29% identity, 86% coverage: 47:331/333 of query aligns to 20:303/309 of 2v4cA

query
sites
2v4cA
A
 
A
A
 
A
S
 
E
L
 
M
L
 
F
E
 
A
K
 
K
R
 
E
I
 
V
N
 
K
E
 
E
E
 
K
M
 
S
N
 
Q
G
 
G
T
 
K
M
 
I
C
 
E
L
 
I
E
 
S
V
 
L
Y
 
Y
P
 
P
N
 
S
S
 
S
T
 
Q
L
 
L
Y
 
G
N
 
D
D
|
D
N
 
R
K
 
A
V
 
M
L
 
L
E
 
K
A
 
Q
M
 
L
L
 
K
Q
 
D
G
 
G
D
 
S
V
 
L
Q
 
D
L
 
F
A
 
T
A
 
F
P
 
A
S
x
E
L
 
S
S
 
A
K
 
R
F
 
F
E
 
Q
K
 
L
F
 
F
T
 
Y
K
 
P
Q
 
E
F
 
A
R
 
A
L
 
V
F
 
F
D
 
A
L
 
L
P
 
P
F
 
Y
M
 
V
F
 
I
K
 
S
N
 
N
I
 
Y
D
 
N
-
 
V
A
 
A
V
 
Q
D
 
K
A
 
A
F
 
L
Q
 
F
G
 
D
S
 
T
E
 
E
N
 
F
G
 
G
Q
 
K
A
 
D
M
 
L
L
 
I
D
 
K
S
 
K
M
 
M
Q
 
D
R
 
K
R
 
D
-
 
L
G
 
G
L
 
V
Q
 
T
G
 
L
L
 
L
S
 
S
Y
 
Q
W
 
A
H
 
Y
N
 
N
G
 
G
M
 
T
K
x
R
Q
 
Q
M
 
T
S
 
T
A
 
S
N
 
N
K
 
R
P
 
A
L
 
I
I
 
N
N
 
S
P
 
I
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
L
R
|
R
V
 
V
Q
 
P
S
 
N
S
 
A
D
 
A
V
 
T
L
 
N
V
 
L
A
 
A
Q
 
Y
M
 
A
E
 
K
A
 
Y
I
 
V
G
 
G
G
 
A
S
 
S
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
|
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
A
N
 
A
I
 
V
Y
 
Q
G
 
A
K
 
Q
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
K
G
 
F
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
L
L
 
N
D
 
D
Y
 
Q
L
 
L
V
 
Y
V
 
L
T
 
V
S
 
S
V
 
N
D
 
E
W
 
T
L
 
Y
D
 
K
S
 
E
L
 
L
D
 
P
P
 
-
A
 
-
V
 
-
R
 
-
E
 
E
Q
 
D
F
 
L
L
 
Q
T
 
K
I
 
V
L
 
V
G
 
K
E
 
D
V
 
A
T
 
A
A
 
E
T
 
N
R
 
A
N
 
A
S
 
K
E
 
Y
S
 
H
T
 
T
K
 
K
V
 
L
N
 
F
A
 
V
E
 
D
A
 
G
R
 
E
Q
 
K
S
 
D
I
 
L
I
 
V
-
 
T
-
 
F
-
 
F
D
 
E
A
 
K
G
 
Q
G
 
G
V
 
V
V
 
-
R
 
-
E
 
K
L
 
I
T
 
T
P
 
H
E
 
P
Q
 
D
R
 
L
A
 
V
A
 
P
W
 
F
V
 
K
E
 
E
A
 
S
M
 
M
K
 
K
P
 
P
V
 
Y
W
 
Y
E
 
A
Q
 
E
F
 
F
A
 
V
G
 
K
D
 
Q
V
 
T
G
 
G
Q
 
Q
D
 
K
M
 
G
I
 
E
D
 
S
A
 
A
A
 
L
Q
 
K
A
 
Q
I
 
I
N
 
E
A
 
A

4mnpA Structure of the sialic acid binding protein from fusobacterium nucleatum subsp. Nucleatum atcc 25586 (see paper)
29% identity, 85% coverage: 47:329/333 of query aligns to 19:303/305 of 4mnpA

query
sites
4mnpA
A
 
A
A
 
A
S
 
E
L
 
V
L
 
F
E
 
A
K
 
K
R
 
E
I
 
L
N
 
K
E
 
K
E
 
R
M
 
S
N
 
N
G
 
G
T
 
E
M
 
I
C
 
E
L
 
L
E
 
K
V
 
L
Y
 
Y
P
 
P
N
 
N
S
 
A
T
 
Q
L
 
L
Y
 
G
N
 
K
D
 
D
N
x
D
K
 
L
V
 
A
L
 
M
E
 
M
A
 
Q
M
 
Q
L
 
L
Q
 
E
G
 
G
D
 
G
-
 
A
V
 
L
Q
 
D
L
 
F
A
 
T
A
x
F
P
 
A
S
x
E
L
 
T
S
 
G
K
x
R
F
 
F
E
 
S
K
 
T
F
 
F
T
 
F
K
 
P
Q
 
E
F
 
A
R
 
E
L
 
V
F
 
F
D
 
T
L
 
L
P
 
P
F
 
Y
M
 
M
F
 
I
K
 
K
N
 
D
I
 
F
D
 
N
A
 
H
V
 
M
D
 
K
A
 
K
F
 
A
Q
 
V
G
 
N
S
 
T
E
 
K
N
 
F
G
 
G
Q
 
K
A
 
D
M
 
L
L
 
F
D
 
K
S
 
K
M
 
V
Q
 
H
-
 
D
R
 
K
R
 
K
G
 
G
L
 
M
Q
 
T
G
 
V
L
 
L
S
 
A
Y
 
Q
W
 
A
H
 
Y
N
 
N
G
 
G
M
 
T
K
x
R
Q
 
Q
M
 
T
S
 
T
A
 
S
N
 
N
K
 
K
P
 
A
L
 
I
I
 
K
N
 
S
P
 
L
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
M
K
 
K
F
 
L
R
|
R
V
 
V
Q
 
P
S
 
G
S
 
A
D
 
A
V
 
A
L
 
N
V
 
L
A
 
A
Q
 
Y
M
 
A
E
 
K
A
 
Y
I
 
T
G
 
E
G
 
A
S
 
A
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
|
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
S
N
 
T
I
 
I
Y
 
K
G
 
A
K
 
Q
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
K
G
 
Y
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
L
L
 
N
D
 
D
-
 
Q
-
 
L
Y
 
Y
L
 
L
V
 
V
-
 
S
-
 
N
V
 
I
T
 
T
S
 
M
V
 
E
D
 
E
W
 
L
L
 
P
D
 
E
S
 
N
L
 
L
D
 
Q
P
 
K
A
 
V
V
 
V
R
 
K
E
 
E
Q
 
S
F
 
-
L
 
-
T
 
-
I
 
-
L
 
-
G
 
A
E
 
E
V
 
V
T
 
A
A
 
A
T
 
E
R
 
Y
N
 
H
S
 
T
E
 
K
S
 
L
T
 
F
K
 
M
V
 
D
N
 
E
A
 
E
E
 
K
A
 
S
R
 
L
Q
 
K
S
 
D
I
 
F
I
 
F
D
 
K
A
 
S
G
 
K
G
 
G
V
 
V
V
 
T
R
 
-
E
 
-
L
 
I
T
 
T
P
 
E
E
 
P
Q
 
N
R
 
L
A
 
V
A
 
D
W
 
F
V
 
K
E
 
K
A
 
A
M
 
M
K
 
K
P
 
P
V
 
F
W
 
Y
E
 
D
Q
 
E
F
 
Y
A
 
I
-
 
K
-
 
K
-
 
N
G
 
G
D
 
K
V
 
V
G
 
G
Q
 
E
D
 
N
M
 
A
I
 
I
D
 
K
A
 
A
A
 
I
Q
 
E
A
 
A
I
 
V

2cexB Structure of a sialic acid binding protein (siap) in the presence of the sialic acid acid analogue neu5ac2en (see paper)
29% identity, 86% coverage: 47:331/333 of query aligns to 19:302/305 of 2cexB

query
sites
2cexB
A
 
A
A
 
A
S
 
E
L
 
M
L
 
F
E
 
A
K
 
K
R
 
E
I
 
V
N
 
K
E
 
E
E
 
K
M
 
S
N
 
Q
G
 
G
T
 
K
M
 
I
C
 
E
L
 
I
E
 
S
V
 
L
Y
 
Y
P
 
P
N
 
S
S
 
S
T
 
Q
L
 
L
Y
 
G
N
 
D
D
 
D
N
 
R
K
 
A
V
 
M
L
 
L
E
 
K
A
 
Q
M
 
L
L
 
K
Q
 
D
G
 
G
D
 
S
V
 
L
Q
 
D
L
 
F
A
 
T
A
 
F
P
 
A
S
x
E
L
 
S
S
 
A
K
 
R
F
 
F
E
 
Q
K
 
L
F
 
F
T
 
Y
K
 
P
Q
 
E
F
 
A
R
 
A
L
 
V
F
 
F
D
 
A
L
 
L
P
 
P
F
 
Y
M
 
V
F
 
I
K
 
S
N
 
N
I
 
Y
D
 
N
-
 
V
A
 
A
V
 
Q
D
 
K
A
 
A
F
 
L
Q
 
F
G
 
D
S
 
T
E
 
E
N
 
F
G
 
G
Q
 
K
A
 
D
M
 
L
L
 
I
D
 
K
S
 
K
M
 
M
Q
 
D
R
 
K
R
 
D
-
 
L
G
 
G
L
 
V
Q
 
T
G
 
L
L
 
L
S
 
S
Y
 
Q
W
 
A
H
 
Y
N
 
N
G
 
G
M
 
T
K
 
R
Q
 
Q
M
 
T
S
 
T
A
 
S
N
 
N
K
 
R
P
 
A
L
 
I
I
 
N
N
 
S
P
 
I
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
L
R
|
R
V
 
V
Q
 
P
S
 
N
S
 
A
D
 
A
V
 
T
L
 
N
V
 
L
A
 
A
Q
 
Y
M
 
A
E
 
K
A
 
Y
I
 
V
G
 
G
G
 
A
S
 
S
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
|
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
A
N
 
A
I
 
V
Y
 
Q
G
 
A
K
 
Q
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
K
G
 
F
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
L
L
 
N
D
 
D
Y
 
Q
L
 
L
V
 
Y
V
 
L
T
 
V
S
 
S
V
 
N
D
 
E
W
 
T
L
 
Y
D
 
K
S
 
E
L
 
L
D
 
P
P
 
-
A
 
-
V
 
-
R
 
-
E
 
E
Q
 
D
F
 
L
L
 
Q
T
 
K
I
 
V
L
 
V
G
 
K
E
 
D
V
 
A
T
 
A
A
 
E
T
 
N
R
 
A
N
 
A
S
 
K
E
 
Y
S
 
H
T
 
T
K
 
K
V
 
L
N
 
F
A
 
V
E
 
D
A
 
G
R
 
E
Q
 
K
S
 
D
I
 
L
I
 
V
-
 
T
-
 
F
-
 
F
D
 
E
A
 
K
G
 
Q
G
 
G
V
 
V
V
 
-
R
 
-
E
 
K
L
 
I
T
 
T
P
 
H
E
 
P
Q
 
D
R
 
L
A
 
V
A
 
P
W
 
F
V
 
K
E
 
E
A
 
S
M
 
M
K
 
K
P
 
P
V
 
Y
W
 
Y
E
 
A
Q
 
E
F
 
F
A
 
V
G
 
K
D
 
Q
V
 
T
G
 
G
Q
 
Q
D
 
K
M
 
G
I
 
E
D
 
S
A
 
A
A
 
L
Q
 
K
A
 
Q
I
 
I
N
 
E
A
 
A

Sites not aligning to the query:

2wx9A Crystal structure of the sialic acid binding periplasmic protein siap (see paper)
29% identity, 86% coverage: 47:331/333 of query aligns to 20:303/308 of 2wx9A

query
sites
2wx9A
A
 
A
A
 
A
S
 
E
L
 
M
L
 
F
E
 
A
K
 
K
R
 
E
I
 
V
N
 
K
E
 
E
E
 
K
M
 
S
N
 
Q
G
 
G
T
 
K
M
 
I
C
 
E
L
 
I
E
 
S
V
 
L
Y
 
Y
P
 
P
N
 
S
S
 
S
T
 
Q
L
 
L
Y
 
G
N
 
D
D
|
D
N
 
R
K
 
A
V
 
M
L
 
L
E
 
K
A
 
Q
M
 
L
L
 
K
Q
 
D
G
 
G
D
 
S
V
 
L
Q
 
D
L
 
F
A
 
T
A
x
F
P
x
A
S
x
E
L
 
S
S
 
A
K
 
R
F
 
F
E
 
Q
K
 
L
F
 
F
T
 
Y
K
 
P
Q
 
E
F
 
A
R
 
A
L
 
V
F
 
F
D
 
A
L
 
L
P
 
P
F
 
Y
M
 
V
F
 
I
K
 
S
N
 
N
I
 
Y
D
 
N
-
 
V
A
 
A
V
 
Q
D
 
K
A
 
A
F
 
L
Q
 
F
G
 
D
S
 
T
E
 
E
N
 
F
G
 
G
Q
 
K
A
 
D
M
 
L
L
 
I
D
 
K
S
 
K
M
 
M
Q
 
D
R
 
K
R
 
D
-
 
L
G
 
G
L
 
V
Q
 
T
G
 
L
L
 
L
S
 
S
Y
 
Q
W
 
A
H
 
Y
N
 
N
G
 
G
M
 
T
K
x
R
Q
 
Q
M
 
T
S
 
T
A
 
S
N
 
N
K
 
R
P
 
A
L
 
I
I
 
N
N
 
S
P
 
I
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
L
R
|
R
V
 
V
Q
 
P
S
 
N
S
 
A
D
 
A
V
 
T
L
 
N
V
 
L
A
 
A
Q
 
Y
M
 
A
E
 
K
A
 
Y
I
 
V
G
 
G
G
 
A
S
 
S
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
|
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
A
N
 
A
I
 
V
Y
 
Q
G
 
A
K
 
Q
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
K
G
 
F
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
L
L
 
N
D
 
D
Y
x
Q
L
 
L
V
 
Y
V
 
L
T
 
V
S
 
S
V
 
N
D
 
E
W
 
T
L
 
Y
D
 
K
S
 
E
L
 
L
D
 
P
P
 
-
A
 
-
V
 
-
R
 
-
E
 
E
Q
 
D
F
 
L
L
 
Q
T
 
K
I
 
V
L
 
V
G
 
K
E
 
D
V
 
A
T
 
A
A
 
E
T
 
N
R
 
A
N
 
A
S
 
K
E
 
Y
S
 
H
T
 
T
K
 
K
V
 
L
N
 
F
A
 
V
E
 
D
A
 
G
R
 
E
Q
 
K
S
 
D
I
 
L
I
 
V
-
 
T
-
 
F
-
 
F
D
 
E
A
 
K
G
 
Q
G
 
G
V
 
V
V
 
-
R
 
-
E
 
K
L
 
I
T
 
T
P
 
H
E
 
P
Q
 
D
R
 
L
A
 
V
A
 
P
W
 
F
V
 
K
E
 
E
A
 
S
M
 
M
K
 
K
P
 
P
V
 
Y
W
 
Y
E
 
A
Q
 
E
F
 
F
A
 
V
G
 
K
D
 
Q
V
 
T
G
 
G
Q
 
Q
D
 
K
M
 
G
I
 
E
D
 
S
A
 
A
A
 
L
Q
 
K
A
 
Q
I
 
I
N
 
E
A
 
A

Sites not aligning to the query:

2cexA Structure of a sialic acid binding protein (siap) in the presence of the sialic acid acid analogue neu5ac2en (see paper)
29% identity, 86% coverage: 47:331/333 of query aligns to 19:302/304 of 2cexA

query
sites
2cexA
A
 
A
A
 
A
S
 
E
L
 
M
L
 
F
E
 
A
K
 
K
R
 
E
I
 
V
N
 
K
E
 
E
E
 
K
M
 
S
N
 
Q
G
 
G
T
 
K
M
 
I
C
 
E
L
 
I
E
 
S
V
 
L
Y
 
Y
P
 
P
N
 
S
S
 
S
T
 
Q
L
 
L
Y
 
G
N
 
D
D
 
D
N
 
R
K
 
A
V
 
M
L
 
L
E
 
K
A
 
Q
M
 
L
L
 
K
Q
 
D
G
 
G
D
 
S
V
 
L
Q
 
D
L
 
F
A
 
T
A
 
F
P
 
A
S
 
E
L
 
S
S
 
A
K
 
R
F
 
F
E
 
Q
K
 
L
F
 
F
T
 
Y
K
 
P
Q
 
E
F
 
A
R
 
A
L
 
V
F
 
F
D
 
A
L
 
L
P
 
P
F
 
Y
M
 
V
F
 
I
K
 
S
N
 
N
I
 
Y
D
 
N
-
 
V
A
 
A
V
 
Q
D
 
K
A
 
A
F
 
L
Q
 
F
G
 
D
S
 
T
E
 
E
N
 
F
G
 
G
Q
 
K
A
 
D
M
 
L
L
 
I
D
 
K
S
 
K
M
 
M
Q
 
D
R
 
K
R
 
D
-
 
L
G
 
G
L
 
V
Q
 
T
G
 
L
L
 
L
S
 
S
Y
 
Q
W
 
A
H
 
Y
N
 
N
G
 
G
M
 
T
K
 
R
Q
 
Q
M
 
T
S
 
T
A
 
S
N
 
N
K
 
R
P
 
A
L
 
I
I
 
N
N
 
S
P
 
I
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
L
R
 
R
V
 
V
Q
 
P
S
 
N
S
 
A
D
 
A
V
 
T
L
 
N
V
 
L
A
 
A
Q
 
Y
M
 
A
E
 
K
A
 
Y
I
 
V
G
 
G
G
 
A
S
 
S
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
 
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
 
N
T
 
P
W
 
L
S
 
A
N
 
A
I
 
V
Y
 
Q
G
 
A
K
 
Q
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
K
G
 
F
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
L
L
 
N
D
 
D
Y
 
Q
L
 
L
V
 
Y
V
 
L
T
 
V
S
 
S
V
 
N
D
 
E
W
 
T
L
 
Y
D
 
K
S
 
E
L
 
L
D
 
P
P
 
-
A
 
-
V
 
-
R
 
-
E
 
E
Q
 
D
F
 
L
L
 
Q
T
 
K
I
 
V
L
 
V
G
 
K
E
 
D
V
 
A
T
 
A
A
 
E
T
 
N
R
 
A
N
 
A
S
 
K
E
 
Y
S
 
H
T
 
T
K
 
K
V
 
L
N
 
F
A
 
V
E
 
D
A
 
G
R
 
E
Q
 
K
S
 
D
I
 
L
I
 
V
-
 
T
-
 
F
-
 
F
D
 
E
A
 
K
G
 
Q
G
 
G
V
 
V
V
 
-
R
 
-
E
 
K
L
 
I
T
 
T
P
 
H
E
 
P
Q
 
D
R
 
L
A
 
V
A
 
P
W
 
F
V
 
K
E
 
E
A
 
S
M
 
M
K
 
K
P
 
P
V
 
Y
W
 
Y
E
 
A
Q
 
E
F
 
F
A
 
V
G
 
K
D
 
Q
V
 
T
G
 
G
Q
 
Q
D
 
K
M
 
G
I
 
E
D
 
S
A
 
A
A
 
L
Q
 
K
A
 
Q
I
 
I
N
 
E
A
 
A

Sites not aligning to the query:

2xwoA Siap r147e mutant in complex with sialylamide (see paper)
29% identity, 86% coverage: 47:331/333 of query aligns to 20:303/308 of 2xwoA

query
sites
2xwoA
A
 
A
A
 
A
S
 
E
L
 
M
L
 
F
E
 
A
K
 
K
R
 
E
I
 
V
N
 
K
E
 
E
E
 
K
M
 
S
N
 
Q
G
 
G
T
 
K
M
 
I
C
 
E
L
 
I
E
 
S
V
 
L
Y
 
Y
P
 
P
N
 
S
S
 
S
T
 
Q
L
 
L
Y
 
G
N
 
D
D
|
D
N
 
R
K
 
A
V
 
M
L
 
L
E
 
K
A
 
Q
M
 
L
L
 
K
Q
 
D
G
 
G
D
 
S
V
 
L
Q
 
D
L
 
F
A
 
T
A
 
F
P
 
A
S
x
E
L
 
S
S
 
A
K
 
R
F
 
F
E
 
Q
K
 
L
F
 
F
T
 
Y
K
 
P
Q
 
E
F
 
A
R
 
A
L
 
V
F
 
F
D
 
A
L
 
L
P
 
P
F
 
Y
M
 
V
F
 
I
K
 
S
N
 
N
I
 
Y
D
 
N
-
 
V
A
 
A
V
 
Q
D
 
K
A
 
A
F
 
L
Q
 
F
G
 
D
S
 
T
E
 
E
N
 
F
G
 
G
Q
 
K
A
 
D
M
 
L
L
 
I
D
 
K
S
 
K
M
 
M
Q
 
D
R
 
K
R
 
D
-
 
L
G
 
G
L
 
V
Q
 
T
G
 
L
L
 
L
S
 
S
Y
 
Q
W
 
A
H
 
Y
N
 
N
G
 
G
M
 
T
K
x
R
Q
 
Q
M
 
T
S
 
T
A
 
S
N
 
N
K
 
R
P
 
A
L
 
I
I
 
N
N
 
S
P
 
I
S
 
A
D
 
D
A
 
M
N
 
K
G
 
G
L
 
L
K
 
K
F
 
L
R
 
E
V
 
V
Q
x
P
S
 
N
S
 
A
D
 
A
V
 
T
L
 
N
V
 
L
A
 
A
Q
 
Y
M
 
A
E
 
K
A
 
Y
I
 
V
G
 
G
G
 
A
S
 
S
P
 
P
Q
 
T
K
 
P
M
 
M
A
 
A
F
|
F
S
 
S
E
 
E
V
 
V
Y
 
Y
G
 
L
A
 
A
L
 
L
Q
 
Q
Q
 
T
G
 
N
V
 
A
V
 
V
D
 
D
G
 
G
Q
 
Q
E
 
E
N
|
N
T
 
P
W
 
L
S
 
A
N
 
A
I
 
V
Y
 
Q
G
 
A
K
 
Q
K
 
K
F
 
F
F
 
Y
E
 
E
V
 
V
Q
 
Q
D
 
K
G
 
F
V
 
L
T
 
A
E
 
M
T
 
T
N
 
N
H
 
H
G
 
I
A
 
L
L
 
N
D
 
D
Y
x
Q
L
 
L
V
 
Y
V
 
L
T
 
V
S
 
S
V
 
N
D
 
E
W
 
T
L
 
Y
D
 
K
S
 
E
L
 
L
D
 
P
P
 
-
A
 
-
V
 
-
R
 
-
E
 
E
Q
 
D
F
 
L
L
 
Q
T
 
K
I
 
V
L
 
V
G
 
K
E
 
D
V
 
A
T
 
A
A
 
E
T
 
N
R
 
A
N
 
A
S
 
K
E
 
Y
S
 
H
T
 
T
K
 
K
V
 
L
N
 
F
A
 
V
E
 
D
A
 
G
R
 
E
Q
 
K
S
 
D
I
 
L
I
 
V
-
 
T
-
 
F
-
 
F
D
 
E
A
 
K
G
 
Q
G
 
G
V
 
V
V
 
-
R
 
-
E
 
K
L
 
I
T
 
T
P
 
H
E
 
P
Q
 
D
R
 
L
A
 
V
A
 
P
W
 
F
V
 
K
E
 
E
A
 
S
M
 
M
K
 
K
P
 
P
V
 
Y
W
 
Y
E
 
A
Q
 
E
F
 
F
A
 
V
G
 
K
D
 
Q
V
 
T
G
 
G
Q
 
Q
D
 
K
M
 
G
I
 
E
D
 
S
A
 
A
A
 
L
Q
 
K
A
 
Q
I
 
I
N
 
E
A
 
A

Sites not aligning to the query:

Query Sequence

>GFF2035 FitnessBrowser__Phaeo:GFF2035
MKFVTAAATAVALTMSAGTAMAACDDGEIVVKFSHVTNTDKHPKGIAASLLEKRINEEMN
GTMCLEVYPNSTLYNDNKVLEAMLQGDVQLAAPSLSKFEKFTKQFRLFDLPFMFKNIDAV
DAFQGSENGQAMLDSMQRRGLQGLSYWHNGMKQMSANKPLINPSDANGLKFRVQSSDVLV
AQMEAIGGSPQKMAFSEVYGALQQGVVDGQENTWSNIYGKKFFEVQDGVTETNHGALDYL
VVTSVDWLDSLDPAVREQFLTILGEVTATRNSESTKVNAEARQSIIDAGGVVRELTPEQR
AAWVEAMKPVWEQFAGDVGQDMIDAAQAINAGM

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory