SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_079555937.1 NCBI__GCF_002201795.1:WP_079555937.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 20 (the maximum) hits to proteins with known functional sites (download)

3dh4A Crystal structure of sodium/sugar symporter with bound galactose from vibrio parahaemolyticus (see paper)
47% identity, 76% coverage: 45:523/631 of query aligns to 19:479/512 of 3dh4A

query
sites
3dh4A
G
 
G
G
 
K
T
 
S
L
 
L
S
 
P
W
 
W
W
 
W
A
 
A
I
 
V
G
 
G
A
 
A
S
 
S
L
 
L
I
 
I
A
 
A
A
 
A
N
 
N
I
|
I
S
 
S
A
 
A
E
 
E
H
x
Q
F
 
F
I
 
I
A
 
G
M
 
M
S
 
S
G
 
G
S
 
S
G
 
G
Y
 
Y
A
 
S
I
 
I
G
 
G
L
 
L
G
 
A
M
 
I
A
 
A
A
 
S
Y
|
Y
E
|
E
W
 
W
I
 
M
A
x
S
A
 
A
I
 
I
V
 
T
L
 
L
I
 
I
L
 
I
V
 
V
A
 
G
K
 
K
Y
 
Y
L
 
F
L
 
L
P
 
P
Q
 
I
M
 
F
L
 
I
D
 
E
K
 
K
K
 
G
I
 
I
F
 
Y
T
 
T
M
 
I
P
 
P
Q
 
E
F
 
F
A
 
V
R
 
E
E
 
K
R
 
R
Y
 
F
G
 
N
S
 
K
G
 
K
V
 
L
S
 
K
F
 
T
F
 
I
F
 
L
S
 
A
F
 
V
F
 
F
W
 
W
L
 
I
L
 
S
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
V
N
 
N
L
 
L
T
 
T
S
 
S
V
 
V
A
 
L
W
 
Y
L
 
L
G
 
G
A
 
G
L
 
L
A
 
A
M
 
L
N
 
E
Q
 
T
I
 
I
L
 
L
G
 
G
V
 
I
P
 
P
I
 
L
L
 
M
Y
 
Y
G
 
S
V
 
I
P
 
L
G
 
G
L
 
L
L
 
A
I
 
L
F
 
F
A
 
A
G
 
L
V
 
V
Y
 
Y
S
 
S
I
 
I
Y
 
-
G
 
-
G
 
-
M
 
-
K
 
-
S
 
-
V
 
V
A
 
V
W
 
W
T
 
T
D
 
D
I
 
V
V
 
I
Q
 
Q
V
 
V
F
 
F
F
 
F
L
 
L
I
 
V
F
 
L
G
 
G
G
 
G
L
 
F
I
 
M
T
 
T
A
 
T
W
 
Y
F
 
M
A
 
A
L
 
V
D
 
S
A
 
F
V
 
I
A
 
G
G
 
G
-
 
T
D
 
D
G
 
G
K
 
W
S
 
-
A
 
-
F
 
F
E
 
A
G
 
G
F
 
V
R
 
S
V
 
K
V
 
M
L
 
V
N
 
D
Q
 
-
I
 
-
R
 
-
A
 
-
S
 
-
E
 
A
T
 
A
D
 
P
T
 
G
H
 
H
F
 
F
N
 
E
M
 
M
I
 
I
I
 
L
G
 
D
D
 
Q
S
 
S
E
 
-
G
 
-
T
 
-
R
 
N
D
 
P
S
 
Q
F
 
Y
L
 
M
N
 
N
L
 
L
P
 
P
G
 
G
L
 
I
A
 
A
V
 
V
I
 
L
F
 
I
G
 
G
A
 
G
M
 
L
W
 
W
L
 
V
T
 
A
N
|
N
I
 
L
G
 
Y
Y
 
Y
W
|
W
G
 
G
F
 
F
N
 
N
Q
 
Q
F
 
Y
I
 
I
I
 
I
Q
 
Q
K
 
R
G
 
T
L
 
L
A
 
A
A
 
A
K
 
K
N
 
S
L
 
V
K
 
S
E
 
E
A
 
A
K
 
Q
R
 
K
G
 
G
L
 
I
L
 
V
F
 
F
A
 
A
A
 
A
Y
 
F
L
 
L
K
|
K
I
 
L
L
 
I
I
 
V
P
 
P
I
 
F
I
 
L
V
 
V
I
 
V
I
 
L
P
 
P
G
 
G
I
 
I
T
 
A
A
 
A
Y
 
Y
V
 
V
I
 
I
H
 
-
G
 
-
M
 
-
S
 
-
V
 
-
E
 
-
T
 
T
A
 
S
D
 
D
G
 
P
S
 
Q
L
 
L
A
 
-
F
 
-
I
 
M
N
 
A
Q
 
S
M
 
L
G
 
G
D
 
D
-
 
I
-
 
A
S
 
A
T
 
T
L
 
N
L
 
L
A
 
P
G
 
-
E
 
S
V
 
A
A
 
A
I
 
N
S
 
A
D
 
D
D
 
K
A
 
A
Y
 
Y
P
 
P
W
 
W
L
 
L
L
 
T
R
 
Q
N
 
-
F
 
F
A
 
L
P
 
P
V
 
V
G
 
G
I
 
V
R
 
K
G
 
G
L
 
V
A
 
V
F
 
F
A
 
A
A
 
A
L
 
L
V
 
A
A
 
A
A
|
A
V
 
I
I
 
V
S
|
S
S
 
S
L
 
L
A
 
A
S
 
S
L
 
M
L
 
L
N
 
N
S
 
S
T
 
T
S
 
A
T
 
T
I
 
I
F
 
F
T
 
T
L
 
M
D
 
D
I
 
I
Y
 
Y
K
 
K
T
 
E
L
 
Y
I
 
I
N
 
S
K
 
P
S
 
D
A
 
S
S
 
G
E
 
D
R
 
H
Q
 
K
L
 
L
V
 
V
R
 
N
V
 
V
G
 
G
R
 
R
F
 
T
A
 
A
A
 
A
F
 
V
V
 
V
A
 
A
L
 
L
A
 
I
I
 
I
A
 
A
I
 
C
V
 
L
A
 
I
A
 
A
R
 
-
P
 
P
L
 
M
L
 
L
G
 
G
G
 
G
L
 
I
D
 
G
Q
 
Q
A
 
A
F
 
F
Q
 
Q
Y
 
Y
I
 
I
Q
|
Q
E
 
E
Y
 
Y
T
 
T
G
 
G
F
 
L
I
 
V
Y
 
S
P
 
P
G
 
G
V
 
I
V
 
L
A
 
A
V
 
V
F
 
F
G
 
L
M
 
L
G
 
G
I
 
L
L
 
F
W
 
W
K
 
K
R
 
K
A
 
T
T
 
T
N
 
S
R
 
K
A
 
G
A
 
A
L
 
I
W
 
I
T
 
G
T
 
V
I
 
V
A
 
A
T
 
S
I
 
I
P
 
P
T
 
F
G
 
A
I
 
L
L
 
F
M
 
L
K
 
K
L
 
F
A
 
M
L
 
P
P
 
L
D
 
S
L
 
M
P
 
P
W
 
F
M
 
M
I
 
D
R
 
Q
M
 
M
G
 
L
Y
 
Y
-
 
T
-
 
L
-
 
L
-
 
F
-
 
T
-
 
M
V
 
V
F
 
V
I
 
I
I
 
A
L
 
F
V
 
T
G
 
S
L
 
L
S
 
S
I
 
T
T
 
S
L
 
I
V
 
N
L
 
D
T
 
D
D
 
D
K
 
P
H
 
K
K
 
G
V
 
I
K
 
S
A
 
V
T
 
T

8hdhA Structure of human sglt2-map17 complex with canagliflozin (see paper)
32% identity, 74% coverage: 9:473/631 of query aligns to 5:467/586 of 8hdhA

query
sites
8hdhA
D
 
D
Y
 
I
L
 
L
I
 
V
F
 
I
G
 
A
A
 
A
Y
 
Y
A
 
F
A
 
L
L
 
L
I
 
V
M
 
I
G
 
G
I
 
V
G
 
G
L
 
L
W
 
W
-
 
S
I
 
M
S
 
C
R
 
R
T
 
T
K
 
N
K
 
R
G
 
G
E
 
T
E
 
-
K
 
-
D
 
-
S
 
V
K
 
G
D
 
G
Y
 
Y
F
 
F
L
 
L
A
 
A
G
 
G
G
 
R
T
 
S
L
 
M
S
 
V
W
 
W
W
 
W
A
 
P
I
 
V
G
 
G
A
 
A
S
 
S
L
 
L
I
 
F
A
|
A
A
x
S
N
|
N
I
|
I
S
x
G
A
 
S
E
x
G
H
|
H
F
 
F
I
 
V
A
x
G
M
x
L
S
 
A
G
 
G
S
 
T
G
 
G
Y
 
A
A
 
A
I
 
S
G
 
G
L
 
L
G
 
A
M
 
V
A
 
A
A
 
G
Y
x
F
E
|
E
W
 
W
I
 
N
A
 
A
A
 
L
I
 
F
V
 
V
L
 
V
I
 
L
L
 
L
V
 
L
A
 
G
K
 
W
Y
 
L
L
 
F
L
 
A
P
 
P
Q
 
V
M
 
Y
L
 
L
D
 
T
K
 
A
K
 
G
I
 
V
F
 
I
T
 
T
M
 
M
P
 
P
Q
 
Q
F
 
Y
A
 
L
R
 
R
E
 
K
R
 
R
Y
 
F
-
 
G
G
 
G
S
 
R
G
 
R
V
 
I
S
 
R
F
 
L
F
 
Y
F
 
L
S
 
S
F
 
V
F
 
L
W
 
S
L
 
L
L
 
F
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
T
N
 
K
L
 
I
T
 
S
S
 
V
V
 
D
A
 
M
W
 
F
L
 
S
G
 
G
A
 
A
L
 
V
A
 
F
M
 
I
N
 
Q
Q
 
Q
I
 
A
L
 
L
G
 
G
V
 
W
P
 
N
I
 
I
L
 
Y
Y
 
A
G
 
S
V
 
V
P
 
I
G
 
A
L
 
L
L
 
L
I
 
G
F
 
I
A
 
T
G
 
M
V
 
I
Y
 
Y
S
 
T
I
 
V
Y
 
T
G
 
G
G
 
G
M
 
L
K
 
A
S
 
A
V
 
L
A
 
M
W
 
Y
T
 
T
D
 
D
I
 
T
V
 
V
Q
 
Q
V
 
T
F
 
F
F
 
V
L
 
I
I
 
L
F
 
G
G
 
G
G
 
A
L
 
C
I
 
I
T
 
L
A
 
M
W
 
G
F
 
Y
A
 
A
L
 
F
D
 
H
A
 
E
V
 
V
A
 
G
G
 
G
D
 
Y
G
 
-
K
 
S
S
 
G
A
 
L
F
 
F
E
 
D
G
 
K
F
 
Y
R
 
L
V
 
G
V
 
A
L
 
A
N
 
T
Q
 
S
I
 
L
R
 
T
A
 
V
S
 
S
E
 
E
T
 
D
D
 
P
T
 
A
H
 
V
F
 
G
N
 
N
M
 
I
I
 
S
I
 
S
G
 
F
D
 
C
S
 
Y
E
 
R
G
 
P
T
 
R
R
 
P
D
 
D
S
 
S
F
 
Y
L
 
H
-
 
L
-
 
L
-
 
R
-
 
H
-
 
P
-
 
V
-
 
T
-
 
G
N
 
D
L
 
L
P
 
P
G
 
W
L
 
P
A
 
A
V
 
L
I
 
L
F
 
L
G
 
G
A
 
-
M
 
L
W
 
T
L
 
I
T
 
V
N
x
S
I
 
G
G
 
W
Y
 
Y
W
|
W
G
 
C
F
 
S
N
 
D
Q
 
Q
F
 
V
I
 
I
I
 
V
Q
 
Q
K
 
R
G
 
C
L
 
L
A
 
A
A
 
G
K
 
K
N
 
S
L
 
L
K
 
T
E
 
H
A
 
I
K
 
K
R
 
A
G
 
G
L
 
C
L
 
I
F
 
L
A
 
C
A
 
G
Y
 
Y
L
 
L
K
 
K
I
 
L
L
 
T
I
 
P
P
 
M
I
 
F
I
 
L
V
 
M
I
 
V
I
 
M
P
 
P
G
 
G
I
 
M
T
 
I
A
 
S
Y
 
R
V
 
I
I
 
L
H
 
Y
G
 
P
M
 
D
S
 
E
V
 
V
E
 
A
T
 
C
A
 
V
D
 
V
G
 
P
S
 
E
L
 
V
A
 
C
F
 
-
I
 
-
N
 
-
Q
 
-
M
 
-
G
 
-
D
 
-
S
 
R
T
 
R
L
 
V
L
 
C
A
 
G
G
 
T
E
 
E
V
 
V
A
 
G
I
 
C
S
 
S
D
 
N
D
 
I
A
 
A
Y
 
Y
P
 
P
W
 
R
L
 
L
L
 
V
R
 
V
N
 
K
F
 
L
A
 
M
P
 
P
V
 
N
G
 
G
I
 
L
R
 
R
G
 
G
L
 
L
A
 
M
F
 
L
A
 
A
A
 
V
L
 
M
V
 
L
A
 
A
A
|
A
V
 
L
I
 
M
S
|
S
S
|
S
L
 
L
A
 
A
S
 
S
L
 
I
L
 
F
N
 
N
S
 
S
T
 
S
S
 
S
T
 
T
I
 
L
F
 
F
T
 
T
L
 
M
D
 
D
I
 
I
Y
 
Y
K
 
-
T
 
T
L
 
R
I
 
L
N
 
R
K
 
P
S
 
R
A
 
A
S
 
G
E
 
D
R
 
R
Q
 
E
L
 
L
V
 
L
R
 
L
V
 
V
G
 
G
R
 
R
F
 
L
-
 
W
-
 
V
-
 
V
-
 
F
-
 
I
-
 
V
A
 
V
A
 
V
F
 
S
V
 
V
A
 
A
L
 
W
A
 
L
I
 
P
A
 
V
I
 
V
V
 
Q
A
 
A
A
 
A
R
 
Q
P
 
-
L
 
-
L
 
-
G
 
G
G
 
G
L
 
-
D
 
-
Q
 
Q
A
 
L
F
|
F
Q
x
D
Y
 
Y
I
 
I
Q
|
Q
E
 
A
Y
 
V
T
 
S
G
 
S
F
 
Y
I
 
L
Y
 
A
P
 
P
G
 
P
V
 
V
V
 
S
A
 
A
V
 
V
F
 
F
G
 
V
M
 
L
G
 
A
I
 
L
L
 
F
W
 
V
K
 
P
R
 
R
A
 
V
T
 
N
N
 
E
R
 
Q
A
 
G
A
 
A
L
 
F
W
 
W

Sites not aligning to the query:

8hb0A Structure of human sglt2-map17 complex with ta1887 (see paper)
32% identity, 74% coverage: 9:473/631 of query aligns to 5:467/586 of 8hb0A

query
sites
8hb0A
D
 
D
Y
 
I
L
 
L
I
 
V
F
 
I
G
 
A
A
 
A
Y
 
Y
A
 
F
A
 
L
L
 
L
I
 
V
M
 
I
G
 
G
I
 
V
G
 
G
L
 
L
W
 
W
-
 
S
I
 
M
S
 
C
R
 
R
T
 
T
K
 
N
K
 
R
G
 
G
E
 
T
E
 
-
K
 
-
D
 
-
S
 
V
K
 
G
D
 
G
Y
 
Y
F
 
F
L
 
L
A
 
A
G
 
G
G
 
R
T
 
S
L
 
M
S
 
V
W
 
W
W
 
W
A
 
P
I
 
V
G
 
G
A
 
A
S
 
S
L
 
L
I
 
F
A
|
A
A
 
S
N
|
N
I
|
I
S
x
G
A
 
S
E
 
G
H
|
H
F
 
F
I
 
V
A
x
G
M
x
L
S
 
A
G
 
G
S
x
T
G
 
G
Y
 
A
A
 
A
I
 
S
G
 
G
L
 
L
G
 
A
M
x
V
A
 
A
A
 
G
Y
x
F
E
|
E
W
 
W
I
 
N
A
 
A
A
 
L
I
 
F
V
 
V
L
 
V
I
 
L
L
 
L
V
 
L
A
 
G
K
 
W
Y
 
L
L
 
F
L
 
A
P
 
P
Q
 
V
M
 
Y
L
 
L
D
 
T
K
 
A
K
 
G
I
 
V
F
 
I
T
 
T
M
 
M
P
 
P
Q
 
Q
F
 
Y
A
 
L
R
 
R
E
 
K
R
 
R
Y
 
F
-
 
G
G
 
G
S
 
R
G
 
R
V
 
I
S
 
R
F
 
L
F
 
Y
F
 
L
S
 
S
F
 
V
F
 
L
W
 
S
L
 
L
L
 
F
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
T
N
 
K
L
 
I
T
 
S
S
x
V
V
 
D
A
 
M
W
 
F
L
 
S
G
 
G
A
 
A
L
 
V
A
 
F
M
 
I
N
 
Q
Q
 
Q
I
 
A
L
 
L
G
 
G
V
 
W
P
 
N
I
 
I
L
 
Y
Y
 
A
G
 
S
V
 
V
P
 
I
G
 
A
L
 
L
L
 
L
I
 
G
F
 
I
A
 
T
G
 
M
V
 
I
Y
 
Y
S
 
T
I
 
V
Y
 
T
G
 
G
G
 
G
M
 
L
K
 
A
S
 
A
V
 
L
A
 
M
W
 
Y
T
 
T
D
 
D
I
 
T
V
 
V
Q
 
Q
V
 
T
F
 
F
F
 
V
L
 
I
I
 
L
F
 
G
G
 
G
G
 
A
L
 
C
I
 
I
T
 
L
A
 
M
W
 
G
F
 
Y
A
 
A
L
 
F
D
 
H
A
 
E
V
 
V
A
 
G
G
 
G
D
 
Y
G
 
-
K
 
S
S
 
G
A
 
L
F
 
F
E
 
D
G
 
K
F
 
Y
R
 
L
V
 
G
V
 
A
L
 
A
N
 
T
Q
 
S
I
 
L
R
 
T
A
 
V
S
 
S
E
 
E
T
 
D
D
 
P
T
 
A
H
 
V
F
 
G
N
 
N
M
 
I
I
 
S
I
 
S
G
 
F
D
 
C
S
 
Y
E
 
R
G
 
P
T
 
R
R
 
P
D
 
D
S
 
S
F
 
Y
L
 
H
-
 
L
-
 
L
-
 
R
-
 
H
-
 
P
-
 
V
-
 
T
-
 
G
N
 
D
L
 
L
P
 
P
G
 
W
L
 
P
A
 
A
V
 
L
I
 
L
F
 
L
G
 
G
A
 
-
M
 
L
W
 
T
L
 
I
T
x
V
N
x
S
I
 
G
G
 
W
Y
 
Y
W
|
W
G
 
C
F
 
S
N
 
D
Q
 
Q
F
 
V
I
 
I
I
 
V
Q
 
Q
K
 
R
G
 
C
L
 
L
A
 
A
A
 
G
K
 
K
N
 
S
L
 
L
K
 
T
E
 
H
A
 
I
K
 
K
R
 
A
G
 
G
L
 
C
L
 
I
F
 
L
A
 
C
A
 
G
Y
 
Y
L
 
L
K
 
K
I
 
L
L
 
T
I
 
P
P
 
M
I
 
F
I
 
L
V
 
M
I
 
V
I
 
M
P
 
P
G
 
G
I
 
M
T
 
I
A
 
S
Y
 
R
V
 
I
I
 
L
H
 
Y
G
 
P
M
 
D
S
 
E
V
 
V
E
 
A
T
 
C
A
 
V
D
 
V
G
 
P
S
 
E
L
 
V
A
 
C
F
 
-
I
 
-
N
 
-
Q
 
-
M
 
-
G
 
-
D
 
-
S
 
R
T
 
R
L
 
V
L
 
C
A
 
G
G
 
T
E
 
E
V
 
V
A
 
G
I
 
C
S
 
S
D
 
N
D
 
I
A
 
A
Y
 
Y
P
 
P
W
 
R
L
 
L
L
 
V
R
 
V
N
 
K
F
 
L
A
 
M
P
 
P
V
 
N
G
 
G
I
 
L
R
 
R
G
 
G
L
 
L
A
 
M
F
 
L
A
 
A
A
 
V
L
 
M
V
 
L
A
 
A
A
|
A
V
 
L
I
 
M
S
|
S
S
|
S
L
 
L
A
 
A
S
 
S
L
 
I
L
 
F
N
 
N
S
 
S
T
 
S
S
 
S
T
 
T
I
 
L
F
 
F
T
 
T
L
 
M
D
 
D
I
 
I
Y
 
Y
K
 
-
T
 
T
L
 
R
I
 
L
N
 
R
K
 
P
S
 
R
A
 
A
S
 
G
E
 
D
R
 
R
Q
 
E
L
 
L
V
 
L
R
 
L
V
 
V
G
 
G
R
 
R
F
 
L
-
 
W
-
 
V
-
 
V
-
 
F
-
 
I
-
 
V
A
 
V
A
 
V
F
 
S
V
 
V
A
 
A
L
 
W
A
 
L
I
 
P
A
 
V
I
 
V
V
 
Q
A
 
A
A
 
A
R
 
Q
P
 
-
L
 
-
L
 
-
G
 
G
G
 
G
L
 
-
D
 
-
Q
 
Q
A
 
L
F
|
F
Q
 
D
Y
 
Y
I
 
I
Q
|
Q
E
 
A
Y
 
V
T
 
S
G
 
S
F
 
Y
I
 
L
Y
 
A
P
 
P
G
 
P
V
 
V
V
 
S
A
 
A
V
 
V
F
 
F
G
 
V
M
 
L
G
 
A
I
 
L
L
 
F
W
 
V
K
 
P
R
 
R
A
 
V
T
 
N
N
 
E
R
 
Q
A
 
G
A
 
A
L
 
F
W
 
W

Sites not aligning to the query:

7vsiA Structure of human sglt2-map17 complex bound with empagliflozin (see paper)
32% identity, 74% coverage: 9:473/631 of query aligns to 5:467/586 of 7vsiA

query
sites
7vsiA
D
 
D
Y
 
I
L
 
L
I
 
V
F
 
I
G
 
A
A
 
A
Y
 
Y
A
 
F
A
 
L
L
 
L
I
 
V
M
 
I
G
 
G
I
 
V
G
 
G
L
 
L
W
 
W
-
 
S
I
 
M
S
 
C
R
 
R
T
 
T
K
 
N
K
 
R
G
 
G
E
 
T
E
 
-
K
 
-
D
 
-
S
 
V
K
 
G
D
 
G
Y
 
Y
F
 
F
L
 
L
A
 
A
G
 
G
G
 
R
T
 
S
L
 
M
S
 
V
W
 
W
W
 
W
A
 
P
I
 
V
G
 
G
A
 
A
S
 
S
L
 
L
I
 
F
A
 
A
A
 
S
N
|
N
I
 
I
S
 
G
A
 
S
E
 
G
H
|
H
F
 
F
I
 
V
A
x
G
M
x
L
S
 
A
G
 
G
S
 
T
G
 
G
Y
 
A
A
 
A
I
 
S
G
 
G
L
 
L
G
 
A
M
x
V
A
 
A
A
 
G
Y
x
F
E
|
E
W
 
W
I
 
N
A
 
A
A
 
L
I
 
F
V
 
V
L
 
V
I
 
L
L
 
L
V
 
L
A
 
G
K
 
W
Y
 
L
L
 
F
L
 
A
P
 
P
Q
 
V
M
 
Y
L
 
L
D
 
T
K
 
A
K
 
G
I
 
V
F
 
I
T
 
T
M
 
M
P
 
P
Q
 
Q
F
 
Y
A
 
L
R
 
R
E
 
K
R
 
R
Y
 
F
-
 
G
G
 
G
S
 
R
G
 
R
V
 
I
S
 
R
F
 
L
F
 
Y
F
 
L
S
 
S
F
 
V
F
 
L
W
 
S
L
 
L
L
 
F
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
T
N
 
K
L
 
I
T
 
S
S
 
V
V
 
D
A
 
M
W
 
F
L
 
S
G
 
G
A
 
A
L
 
V
A
 
F
M
 
I
N
 
Q
Q
 
Q
I
 
A
L
 
L
G
 
G
V
 
W
P
 
N
I
 
I
L
 
Y
Y
 
A
G
 
S
V
 
V
P
 
I
G
 
A
L
 
L
L
 
L
I
 
G
F
 
I
A
 
T
G
 
M
V
 
I
Y
 
Y
S
 
T
I
 
V
Y
 
T
G
 
G
G
 
G
M
 
L
K
 
A
S
 
A
V
 
L
A
 
M
W
 
Y
T
 
T
D
 
D
I
 
T
V
 
V
Q
 
Q
V
 
T
F
 
F
F
 
V
L
 
I
I
 
L
F
 
G
G
 
G
G
 
A
L
 
C
I
 
I
T
 
L
A
 
M
W
 
G
F
 
Y
A
 
A
L
 
F
D
 
H
A
 
E
V
 
V
A
 
G
G
 
G
D
 
Y
G
 
-
K
 
S
S
 
G
A
 
L
F
 
F
E
 
D
G
 
K
F
 
Y
R
 
L
V
 
G
V
 
A
L
 
A
N
 
T
Q
 
S
I
 
L
R
 
T
A
 
V
S
 
S
E
 
E
T
 
D
D
 
P
T
 
A
H
 
V
F
 
G
N
 
N
M
 
I
I
 
S
I
 
S
G
 
F
D
 
C
S
 
Y
E
 
R
G
 
P
T
 
R
R
 
P
D
 
D
S
 
S
F
 
Y
L
 
H
-
 
L
-
 
L
-
 
R
-
 
H
-
 
P
-
 
V
-
 
T
-
 
G
N
 
D
L
 
L
P
 
P
G
 
W
L
 
P
A
 
A
V
 
L
I
 
L
F
 
L
G
 
G
A
 
-
M
 
L
W
 
T
L
 
I
T
x
V
N
x
S
I
 
G
G
 
W
Y
|
Y
W
 
W
G
 
C
F
 
S
N
 
D
Q
 
Q
F
 
V
I
 
I
I
 
V
Q
 
Q
K
 
R
G
 
C
L
 
L
A
 
A
A
 
G
K
 
K
N
 
S
L
 
L
K
 
T
E
 
H
A
 
I
K
 
K
R
 
A
G
 
G
L
 
C
L
 
I
F
 
L
A
 
C
A
 
G
Y
 
Y
L
 
L
K
 
K
I
 
L
L
 
T
I
 
P
P
 
M
I
 
F
I
 
L
V
 
M
I
 
V
I
 
M
P
 
P
G
 
G
I
 
M
T
 
I
A
 
S
Y
 
R
V
 
I
I
 
L
H
 
Y
G
 
P
M
 
D
S
 
E
V
 
V
E
 
A
T
 
C
A
 
V
D
 
V
G
 
P
S
 
E
L
 
V
A
 
C
F
 
-
I
 
-
N
 
-
Q
 
-
M
 
-
G
 
-
D
 
-
S
 
R
T
 
R
L
 
V
L
 
C
A
 
G
G
 
T
E
 
E
V
 
V
A
 
G
I
 
C
S
 
S
D
 
N
D
 
I
A
 
A
Y
 
Y
P
 
P
W
 
R
L
 
L
L
 
V
R
 
V
N
 
K
F
 
L
A
 
M
P
 
P
V
 
N
G
 
G
I
 
L
R
 
R
G
 
G
L
 
L
A
 
M
F
 
L
A
 
A
A
 
V
L
 
M
V
 
L
A
 
A
A
 
A
V
 
L
I
 
M
S
 
S
S
 
S
L
 
L
A
 
A
S
 
S
L
 
I
L
 
F
N
 
N
S
 
S
T
 
S
S
 
S
T
 
T
I
 
L
F
 
F
T
 
T
L
 
M
D
 
D
I
 
I
Y
 
Y
K
 
-
T
 
T
L
 
R
I
 
L
N
 
R
K
 
P
S
 
R
A
 
A
S
 
G
E
 
D
R
 
R
Q
 
E
L
 
L
V
 
L
R
 
L
V
 
V
G
 
G
R
 
R
F
 
L
-
 
W
-
 
V
-
 
V
-
 
F
-
 
I
-
 
V
A
 
V
A
 
V
F
 
S
V
 
V
A
 
A
L
 
W
A
 
L
I
 
P
A
 
V
I
 
V
V
 
Q
A
 
A
A
 
A
R
 
Q
P
 
-
L
 
-
L
 
-
G
 
G
G
 
G
L
 
-
D
 
-
Q
 
Q
A
 
L
F
|
F
Q
x
D
Y
 
Y
I
 
I
Q
|
Q
E
 
A
Y
 
V
T
 
S
G
 
S
F
 
Y
I
 
L
Y
 
A
P
 
P
G
 
P
V
 
V
V
 
S
A
 
A
V
 
V
F
 
F
G
 
V
M
 
L
G
 
A
I
 
L
L
 
F
W
 
V
K
 
P
R
 
R
A
 
V
T
 
N
N
 
E
R
 
Q
A
 
G
A
 
A
L
 
F
W
 
W

8hg7A Structure of human sglt2-map17 complex with sotagliflozin (see paper)
32% identity, 74% coverage: 9:473/631 of query aligns to 5:467/590 of 8hg7A

query
sites
8hg7A
D
 
D
Y
 
I
L
 
L
I
 
V
F
 
I
G
 
A
A
 
A
Y
 
Y
A
 
F
A
 
L
L
 
L
I
 
V
M
 
I
G
 
G
I
 
V
G
 
G
L
 
L
W
 
W
-
 
S
I
 
M
S
 
C
R
 
R
T
 
T
K
 
N
K
 
R
G
 
G
E
 
T
E
 
-
K
 
-
D
 
-
S
 
V
K
 
G
D
 
G
Y
 
Y
F
 
F
L
 
L
A
 
A
G
 
G
G
 
R
T
 
S
L
 
M
S
 
V
W
 
W
W
 
W
A
 
P
I
 
V
G
 
G
A
 
A
S
 
S
L
 
L
I
 
F
A
|
A
A
x
S
N
|
N
I
|
I
S
x
G
A
 
S
E
x
G
H
|
H
F
 
F
I
 
V
A
x
G
M
x
L
S
 
A
G
 
G
S
 
T
G
 
G
Y
 
A
A
 
A
I
 
S
G
 
G
L
 
L
G
 
A
M
 
V
A
 
A
A
 
G
Y
 
F
E
|
E
W
 
W
I
 
N
A
 
A
A
 
L
I
 
F
V
 
V
L
 
V
I
 
L
L
 
L
V
 
L
A
 
G
K
 
W
Y
 
L
L
 
F
L
 
A
P
 
P
Q
 
V
M
 
Y
L
 
L
D
 
T
K
 
A
K
 
G
I
 
V
F
 
I
T
 
T
M
 
M
P
 
P
Q
 
Q
F
 
Y
A
 
L
R
 
R
E
 
K
R
 
R
Y
 
F
-
 
G
G
 
G
S
 
R
G
 
R
V
 
I
S
 
R
F
 
L
F
 
Y
F
 
L
S
 
S
F
 
V
F
 
L
W
 
S
L
 
L
L
 
F
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
T
N
 
K
L
 
I
T
 
S
S
 
V
V
 
D
A
 
M
W
 
F
L
 
S
G
 
G
A
 
A
L
 
V
A
 
F
M
 
I
N
 
Q
Q
 
Q
I
 
A
L
 
L
G
 
G
V
 
W
P
 
N
I
 
I
L
 
Y
Y
 
A
G
 
S
V
 
V
P
 
I
G
 
A
L
 
L
L
 
L
I
 
G
F
 
I
A
 
T
G
 
M
V
 
I
Y
 
Y
S
 
T
I
 
V
Y
 
T
G
 
G
G
 
G
M
 
L
K
 
A
S
 
A
V
 
L
A
 
M
W
 
Y
T
 
T
D
 
D
I
 
T
V
 
V
Q
 
Q
V
 
T
F
 
F
F
 
V
L
 
I
I
 
L
F
 
G
G
 
G
G
 
A
L
 
C
I
 
I
T
 
L
A
 
M
W
 
G
F
 
Y
A
 
A
L
 
F
D
 
H
A
 
E
V
 
V
A
 
G
G
 
G
D
 
Y
G
 
-
K
 
S
S
 
G
A
 
L
F
 
F
E
 
D
G
 
K
F
 
Y
R
 
L
V
 
G
V
 
A
L
 
A
N
 
T
Q
 
S
I
 
L
R
 
T
A
 
V
S
 
S
E
 
E
T
 
D
D
 
P
T
 
A
H
 
V
F
 
G
N
 
N
M
 
I
I
 
S
I
 
S
G
 
F
D
 
C
S
 
Y
E
 
R
G
 
P
T
 
R
R
 
P
D
 
D
S
 
S
F
 
Y
L
 
H
-
 
L
-
 
L
-
 
R
-
 
H
-
 
P
-
 
V
-
 
T
-
 
G
N
 
D
L
 
L
P
 
P
G
 
W
L
 
P
A
 
A
V
 
L
I
 
L
F
 
L
G
 
G
A
 
-
M
 
L
W
 
T
L
 
I
T
x
V
N
x
S
I
 
G
G
 
W
Y
|
Y
W
|
W
G
 
C
F
 
S
N
 
D
Q
 
Q
F
 
V
I
 
I
I
 
V
Q
 
Q
K
 
R
G
 
C
L
 
L
A
 
A
A
 
G
K
 
K
N
 
S
L
 
L
K
 
T
E
 
H
A
 
I
K
 
K
R
 
A
G
 
G
L
 
C
L
 
I
F
 
L
A
 
C
A
 
G
Y
 
Y
L
 
L
K
|
K
I
 
L
L
 
T
I
 
P
P
 
M
I
 
F
I
 
L
V
 
M
I
 
V
I
 
M
P
 
P
G
 
G
I
 
M
T
 
I
A
 
S
Y
 
R
V
 
I
I
 
L
H
 
Y
G
 
P
M
 
D
S
 
E
V
 
V
E
 
A
T
 
C
A
 
V
D
 
V
G
 
P
S
 
E
L
 
V
A
 
C
F
 
-
I
 
-
N
 
-
Q
 
-
M
 
-
G
 
-
D
 
-
S
 
R
T
 
R
L
 
V
L
 
C
A
 
G
G
 
T
E
 
E
V
 
V
A
 
G
I
 
C
S
 
S
D
 
N
D
 
I
A
 
A
Y
 
Y
P
 
P
W
 
R
L
 
L
L
 
V
R
 
V
N
 
K
F
 
L
A
 
M
P
 
P
V
 
N
G
 
G
I
 
L
R
 
R
G
 
G
L
 
L
A
 
M
F
 
L
A
 
A
A
 
V
L
 
M
V
 
L
A
 
A
A
|
A
V
 
L
I
 
M
S
|
S
S
|
S
L
 
L
A
 
A
S
 
S
L
 
I
L
 
F
N
 
N
S
 
S
T
 
S
S
 
S
T
 
T
I
 
L
F
 
F
T
 
T
L
 
M
D
 
D
I
 
I
Y
 
Y
K
 
-
T
 
T
L
 
R
I
 
L
N
 
R
K
 
P
S
 
R
A
 
A
S
 
G
E
 
D
R
 
R
Q
 
E
L
 
L
V
 
L
R
 
L
V
 
V
G
 
G
R
 
R
F
 
L
-
 
W
-
 
V
-
 
V
-
 
F
-
 
I
-
 
V
A
 
V
A
 
V
F
 
S
V
 
V
A
 
A
L
 
W
A
 
L
I
 
P
A
 
V
I
 
V
V
 
Q
A
 
A
A
 
A
R
 
Q
P
 
-
L
 
-
L
 
-
G
 
G
G
 
G
L
 
-
D
 
-
Q
 
Q
A
 
L
F
|
F
Q
 
D
Y
 
Y
I
 
I
Q
|
Q
E
 
A
Y
 
V
T
 
S
G
 
S
F
 
Y
I
 
L
Y
 
A
P
 
P
G
 
P
V
 
V
V
 
S
A
 
A
V
 
V
F
 
F
G
 
V
M
 
L
G
 
A
I
 
L
L
 
F
W
 
V
K
 
P
R
 
R
A
 
V
T
 
N
N
 
E
R
 
Q
A
 
G
A
 
A
L
 
F
W
 
W

Sites not aligning to the query:

8hezA Structure of human sglt2-map17 complex with dapagliflozin (see paper)
32% identity, 74% coverage: 9:473/631 of query aligns to 5:467/582 of 8hezA

query
sites
8hezA
D
 
D
Y
 
I
L
 
L
I
 
V
F
 
I
G
 
A
A
 
A
Y
 
Y
A
 
F
A
 
L
L
 
L
I
 
V
M
 
I
G
 
G
I
 
V
G
 
G
L
 
L
W
 
W
-
 
S
I
 
M
S
 
C
R
 
R
T
 
T
K
 
N
K
 
R
G
 
G
E
 
T
E
 
-
K
 
-
D
 
-
S
 
V
K
 
G
D
 
G
Y
 
Y
F
 
F
L
 
L
A
 
A
G
 
G
G
 
R
T
 
S
L
 
M
S
 
V
W
 
W
W
 
W
A
 
P
I
 
V
G
 
G
A
 
A
S
 
S
L
 
L
I
 
F
A
|
A
A
 
S
N
|
N
I
|
I
S
x
G
A
 
S
E
x
G
H
|
H
F
 
F
I
 
V
A
x
G
M
x
L
S
 
A
G
 
G
S
x
T
G
 
G
Y
 
A
A
 
A
I
 
S
G
 
G
L
 
L
G
 
A
M
 
V
A
 
A
A
 
G
Y
x
F
E
|
E
W
 
W
I
 
N
A
 
A
A
 
L
I
 
F
V
 
V
L
 
V
I
 
L
L
 
L
V
 
L
A
 
G
K
 
W
Y
 
L
L
 
F
L
 
A
P
 
P
Q
 
V
M
 
Y
L
 
L
D
 
T
K
 
A
K
 
G
I
 
V
F
 
I
T
 
T
M
 
M
P
 
P
Q
 
Q
F
 
Y
A
 
L
R
 
R
E
 
K
R
 
R
Y
 
F
-
 
G
G
 
G
S
 
R
G
 
R
V
 
I
S
 
R
F
 
L
F
 
Y
F
 
L
S
 
S
F
 
V
F
 
L
W
 
S
L
 
L
L
 
F
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
T
N
 
K
L
 
I
T
 
S
S
 
V
V
 
D
A
 
M
W
 
F
L
 
S
G
 
G
A
 
A
L
 
V
A
 
F
M
 
I
N
 
Q
Q
 
Q
I
 
A
L
 
L
G
 
G
V
 
W
P
 
N
I
 
I
L
 
Y
Y
 
A
G
 
S
V
 
V
P
 
I
G
 
A
L
 
L
L
 
L
I
 
G
F
 
I
A
 
T
G
 
M
V
 
I
Y
 
Y
S
 
T
I
 
V
Y
 
T
G
 
G
G
 
G
M
 
L
K
 
A
S
 
A
V
 
L
A
 
M
W
 
Y
T
 
T
D
 
D
I
 
T
V
 
V
Q
 
Q
V
 
T
F
 
F
F
 
V
L
 
I
I
 
L
F
 
G
G
 
G
G
 
A
L
 
C
I
 
I
T
 
L
A
 
M
W
 
G
F
 
Y
A
 
A
L
 
F
D
 
H
A
 
E
V
 
V
A
 
G
G
 
G
D
 
Y
G
 
-
K
 
S
S
 
G
A
 
L
F
 
F
E
 
D
G
 
K
F
 
Y
R
 
L
V
 
G
V
 
A
L
 
A
N
 
T
Q
 
S
I
 
L
R
 
T
A
 
V
S
 
S
E
 
E
T
 
D
D
 
P
T
 
A
H
 
V
F
 
G
N
 
N
M
 
I
I
 
S
I
 
S
G
 
F
D
 
C
S
 
Y
E
 
R
G
 
P
T
 
R
R
 
P
D
 
D
S
 
S
F
 
Y
L
 
H
-
 
L
-
 
L
-
 
R
-
 
H
-
 
P
-
 
V
-
 
T
-
 
G
N
 
D
L
 
L
P
 
P
G
 
W
L
 
P
A
 
A
V
 
L
I
 
L
F
 
L
G
 
G
A
 
-
M
 
L
W
 
T
L
 
I
T
x
V
N
x
S
I
 
G
G
 
W
Y
 
Y
W
|
W
G
 
C
F
 
S
N
 
D
Q
 
Q
F
 
V
I
 
I
I
 
V
Q
 
Q
K
 
R
G
 
C
L
 
L
A
 
A
A
 
G
K
 
K
N
 
S
L
 
L
K
 
T
E
 
H
A
 
I
K
 
K
R
 
A
G
 
G
L
 
C
L
 
I
F
 
L
A
 
C
A
 
G
Y
 
Y
L
 
L
K
|
K
I
 
L
L
 
T
I
 
P
P
 
M
I
 
F
I
 
L
V
 
M
I
 
V
I
 
M
P
 
P
G
 
G
I
 
M
T
 
I
A
 
S
Y
 
R
V
 
I
I
 
L
H
 
Y
G
 
P
M
 
D
S
 
E
V
 
V
E
 
A
T
 
C
A
 
V
D
 
V
G
 
P
S
 
E
L
 
V
A
 
C
F
 
-
I
 
-
N
 
-
Q
 
-
M
 
-
G
 
-
D
 
-
S
 
R
T
 
R
L
 
V
L
 
C
A
 
G
G
 
T
E
 
E
V
 
V
A
 
G
I
 
C
S
 
S
D
 
N
D
 
I
A
 
A
Y
 
Y
P
 
P
W
 
R
L
 
L
L
 
V
R
 
V
N
 
K
F
 
L
A
 
M
P
 
P
V
 
N
G
 
G
I
 
L
R
 
R
G
 
G
L
 
L
A
 
M
F
 
L
A
 
A
A
 
V
L
 
M
V
 
L
A
 
A
A
|
A
V
 
L
I
 
M
S
|
S
S
|
S
L
 
L
A
 
A
S
 
S
L
 
I
L
 
F
N
 
N
S
 
S
T
 
S
S
 
S
T
 
T
I
 
L
F
 
F
T
 
T
L
 
M
D
 
D
I
 
I
Y
 
Y
K
 
-
T
 
T
L
 
R
I
 
L
N
 
R
K
 
P
S
 
R
A
 
A
S
 
G
E
 
D
R
 
R
Q
 
E
L
 
L
V
 
L
R
 
L
V
 
V
G
 
G
R
 
R
F
 
L
-
 
W
-
 
V
-
 
V
-
 
F
-
 
I
-
 
V
A
 
V
A
 
V
F
 
S
V
 
V
A
 
A
L
 
W
A
 
L
I
 
P
A
 
V
I
 
V
V
 
Q
A
 
A
A
 
A
R
 
Q
P
 
-
L
 
-
L
 
-
G
 
G
G
 
G
L
 
-
D
 
-
Q
 
Q
A
 
L
F
|
F
Q
 
D
Y
 
Y
I
 
I
Q
|
Q
E
 
A
Y
 
V
T
 
S
G
 
S
F
 
Y
I
 
L
Y
 
A
P
 
P
G
 
P
V
 
V
V
 
S
A
 
A
V
 
V
F
 
F
G
 
V
M
 
L
G
 
A
I
 
L
L
 
F
W
 
V
K
 
P
R
 
R
A
 
V
T
 
N
N
 
E
R
 
Q
A
 
G
A
 
A
L
 
F
W
 
W

Sites not aligning to the query:

P31639 Sodium/glucose cotransporter 2; Na(+)/glucose cotransporter 2; Low affinity sodium-glucose cotransporter; Solute carrier family 5 member 2 from Homo sapiens (Human) (see paper)
32% identity, 74% coverage: 9:473/631 of query aligns to 25:487/672 of P31639

query
sites
P31639
D
 
D
Y
 
I
L
 
L
I
 
V
F
 
I
G
 
A
A
 
A
Y
 
Y
A
 
F
A
 
L
L
 
L
I
 
V
M
 
I
G
 
G
I
 
V
G
 
G
L
 
L
W
 
W
-
 
S
I
 
M
S
 
C
R
 
R
T
 
T
K
 
N
K
 
R
G
 
G
E
 
-
E
 
-
K
 
-
D
 
T
S
 
V
K
 
G
D
 
G
Y
 
Y
F
 
F
L
 
L
A
 
A
G
 
G
G
 
R
T
 
S
L
 
M
S
 
V
W
 
W
W
 
W
A
 
P
I
 
V
G
 
G
A
 
A
S
 
S
L
 
L
I
 
F
A
 
A
A
 
S
N
 
N
I
 
I
S
 
G
A
 
S
E
 
G
H
 
H
F
 
F
I
 
V
A
 
G
M
 
L
S
 
A
G
 
G
S
 
T
G
 
G
Y
 
A
A
 
A
I
 
S
G
 
G
L
 
L
G
 
A
M
x
V
A
 
A
A
 
G
Y
x
F
E
 
E
W
 
W
I
 
N
A
 
A
A
 
L
I
 
F
V
 
V
L
 
V
I
 
L
L
 
L
V
 
L
A
 
G
K
 
W
Y
 
L
L
 
F
L
 
A
P
 
P
Q
 
V
M
 
Y
L
 
L
D
 
T
K
 
A
K
 
G
I
 
V
F
 
I
T
 
T
M
 
M
P
 
P
Q
 
Q
F
 
Y
A
 
L
R
 
R
E
 
K
R
 
R
Y
 
F
-
 
G
G
 
G
S
 
R
G
 
R
V
 
I
S
 
R
F
 
L
F
 
Y
F
 
L
S
 
S
F
 
V
F
 
L
W
 
S
L
 
L
L
 
F
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
T
N
 
K
L
 
I
T
 
S
S
x
V
V
 
D
A
 
M
W
 
F
L
 
S
G
 
G
A
 
A
L
 
V
A
 
F
M
 
I
N
 
Q
Q
 
Q
I
 
A
L
 
L
G
 
G
V
 
W
P
 
N
I
 
I
L
 
Y
Y
 
A
G
 
S
V
 
V
P
 
I
G
 
A
L
 
L
L
 
L
I
 
G
F
 
I
A
 
T
G
 
M
V
 
I
Y
 
Y
S
 
T
I
 
V
Y
 
T
G
 
G
G
 
G
M
 
L
K
 
A
S
 
A
V
 
L
A
 
M
W
 
Y
T
 
T
D
 
D
I
 
T
V
 
V
Q
 
Q
V
 
T
F
 
F
F
 
V
L
 
I
I
 
L
F
 
G
G
 
G
G
 
A
L
 
C
I
 
I
T
 
L
A
 
M
W
 
G
F
 
Y
A
 
A
L
 
F
D
 
H
A
 
E
V
 
V
A
 
G
G
 
G
D
 
Y
G
 
-
K
 
S
S
 
G
A
 
L
F
 
F
E
 
D
G
 
K
F
 
Y
R
 
L
V
 
G
V
 
A
L
 
A
N
 
T
Q
 
S
I
 
L
R
 
T
A
 
V
S
 
S
E
 
E
T
 
D
D
 
P
T
 
A
H
 
V
F
 
G
N
 
N
M
 
I
I
 
S
I
 
S
G
 
F
D
 
C
S
 
Y
E
 
R
G
 
P
T
 
R
R
 
P
D
 
D
S
 
S
F
 
Y
L
 
H
-
 
L
-
 
L
-
 
R
-
 
H
-
 
P
-
 
V
-
 
T
-
 
G
N
 
D
L
 
L
P
 
P
G
 
W
L
 
P
A
 
A
V
 
L
I
 
L
F
 
L
G
 
G
A
 
-
M
x
L
W
 
T
L
 
I
T
 
V
N
 
S
I
 
G
G
 
W
Y
 
Y
W
 
W
G
 
C
F
 
S
N
 
D
Q
 
Q
F
 
V
I
 
I
I
 
V
Q
 
Q
K
 
R
G
 
C
L
 
L
A
 
A
A
 
G
K
 
K
N
 
S
L
 
L
K
 
T
E
 
H
A
 
I
K
 
K
R
 
A
G
 
G
L
 
C
L
 
I
F
 
L
A
 
C
A
 
G
Y
 
Y
L
 
L
K
 
K
I
 
L
L
 
T
I
 
P
P
 
M
I
 
F
I
 
L
V
 
M
I
 
V
I
 
M
P
 
P
G
 
G
I
 
M
T
 
I
A
 
S
Y
 
R
V
 
I
I
 
L
H
 
Y
G
 
P
M
 
D
S
 
E
V
 
V
E
 
A
T
 
C
A
 
V
D
 
V
G
 
P
S
 
E
L
 
V
A
 
C
F
 
-
I
 
-
N
 
-
Q
 
-
M
 
-
G
 
-
D
 
-
S
 
R
T
 
R
L
 
V
L
 
C
A
 
G
G
 
T
E
 
E
V
 
V
A
 
G
I
 
C
S
 
S
D
 
N
D
 
I
A
 
A
Y
 
Y
P
 
P
W
 
R
L
 
L
L
 
V
R
 
V
N
 
K
F
 
L
A
 
M
P
 
P
V
 
N
G
 
G
I
 
L
R
 
R
G
 
G
L
 
L
A
 
M
F
 
L
A
 
A
A
 
V
L
 
M
V
 
L
A
 
A
A
 
A
V
 
L
I
 
M
S
 
S
S
 
S
L
 
L
A
 
A
S
 
S
L
 
I
L
 
F
N
 
N
S
 
S
T
 
S
S
 
S
T
 
T
I
 
L
F
 
F
T
 
T
L
 
M
D
 
D
I
 
I
Y
 
Y
K
 
-
T
 
T
L
 
R
I
 
L
N
 
R
K
 
P
S
 
R
A
 
A
S
 
G
E
 
D
R
 
R
Q
 
E
L
 
L
V
 
L
R
 
L
V
 
V
G
 
G
R
 
R
F
 
L
-
 
W
-
 
V
-
 
V
-
 
F
-
 
I
-
 
V
A
 
V
A
 
V
F
 
S
V
 
V
A
 
A
L
 
W
A
 
L
I
 
P
A
 
V
I
 
V
V
 
Q
A
 
A
A
 
A
R
 
Q
P
 
-
L
 
-
L
 
-
G
 
G
G
 
G
L
 
-
D
 
-
Q
 
Q
A
 
L
F
|
F
Q
 
D
Y
 
Y
I
 
I
Q
 
Q
E
 
A
Y
 
V
T
 
S
G
 
S
F
 
Y
I
 
L
Y
 
A
P
 
P
G
 
P
V
 
V
V
 
S
A
 
A
V
 
V
F
 
F
G
 
V
M
 
L
G
 
A
I
 
L
L
 
F
W
 
V
K
 
P
R
 
R
A
 
V
T
 
N
N
 
E
R
 
Q
A
 
G
A
 
A
L
 
F
W
 
W

7wmvA Structure of human sglt1-map17 complex bound with lx2761 (see paper)
32% identity, 74% coverage: 9:473/631 of query aligns to 11:470/602 of 7wmvA

query
sites
7wmvA
D
 
D
Y
 
I
L
 
S
I
 
I
F
 
I
G
 
V
A
 
I
Y
 
Y
A
 
F
A
 
V
L
 
V
I
 
V
M
 
M
G
 
A
I
 
V
G
 
G
L
 
L
W
 
W
-
 
A
I
 
M
S
 
F
R
 
S
T
 
T
K
 
N
K
 
R
G
 
G
E
 
-
E
 
-
K
 
-
D
 
T
S
 
V
K
 
G
D
 
G
Y
 
F
F
 
F
L
 
L
A
 
A
G
 
G
G
 
R
T
 
S
L
 
M
S
 
V
W
 
W
W
 
W
A
 
P
I
 
I
G
 
G
A
 
A
S
 
S
L
 
L
I
 
F
A
 
A
A
 
S
N
|
N
I
 
I
S
 
G
A
 
S
E
 
G
H
|
H
F
 
F
I
 
V
A
 
G
M
x
L
S
 
A
G
 
G
S
 
T
G
 
G
Y
 
A
A
 
A
I
 
S
G
 
G
L
 
I
G
 
A
M
x
I
A
 
G
A
 
G
Y
x
F
E
 
E
W
 
W
I
 
N
A
 
A
A
 
L
I
 
V
V
 
L
L
 
V
I
 
V
L
 
V
V
 
L
A
 
G
K
 
W
Y
 
L
L
 
F
L
 
V
P
 
P
Q
 
I
M
 
Y
L
 
I
D
 
K
K
 
A
K
 
G
I
 
V
F
 
V
T
 
T
M
 
M
P
 
P
Q
 
E
F
 
Y
A
 
L
R
 
R
E
 
K
R
 
R
Y
 
F
-
 
G
G
 
G
S
 
Q
G
 
R
V
 
I
S
 
Q
F
 
V
F
 
Y
F
 
L
S
 
S
F
 
L
F
 
L
W
 
S
L
 
L
L
 
L
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
T
N
 
K
L
 
I
T
 
S
S
 
A
V
 
D
A
 
I
W
 
F
L
 
S
G
 
G
A
 
A
L
 
I
A
 
F
M
 
I
N
 
N
Q
 
L
I
 
A
L
 
L
G
 
G
V
 
L
P
 
N
I
 
L
L
 
Y
Y
 
L
G
 
A
V
 
I
P
 
F
G
 
L
L
 
L
L
 
L
I
 
A
F
 
I
A
 
T
G
 
A
V
 
L
Y
 
Y
S
 
T
I
 
I
Y
 
T
G
 
G
G
 
G
M
 
L
K
 
A
S
 
A
V
 
V
A
 
I
W
 
Y
T
 
T
D
 
D
I
 
T
V
 
L
Q
 
Q
V
 
T
F
 
V
F
 
I
L
 
M
I
 
L
F
 
V
G
 
G
G
 
S
L
 
L
I
 
I
T
 
L
A
 
T
W
 
G
F
 
F
A
 
A
L
 
F
D
 
H
A
 
E
V
 
V
A
 
G
G
 
-
D
 
-
G
 
G
K
 
Y
S
 
D
A
 
A
F
 
F
-
 
M
E
 
E
G
 
K
F
 
Y
R
 
M
V
 
K
V
 
A
L
 
I
N
 
P
Q
 
T
I
 
I
R
 
-
A
 
V
S
 
S
E
 
D
T
 
G
D
 
N
T
 
T
H
 
T
F
 
F
N
 
Q
M
 
E
I
 
K
I
 
C
G
 
Y
D
 
T
S
 
P
E
 
R
G
 
A
T
 
D
-
 
S
-
 
F
-
 
H
-
 
I
-
 
F
R
 
R
D
 
D
S
 
P
F
 
L
L
 
T
-
 
G
N
 
D
L
|
L
P
 
P
G
 
W
L
 
P
A
 
G
V
 
F
I
 
I
F
 
F
G
 
G
A
 
-
M
|
M
W
 
S
L
 
I
T
x
L
N
x
T
I
 
L
G
 
W
Y
|
Y
W
|
W
G
 
C
F
 
T
N
 
D
Q
 
Q
F
 
V
I
 
I
I
 
V
Q
 
Q
K
 
R
G
 
C
L
 
L
A
 
S
A
 
A
K
 
K
N
 
N
L
 
M
K
 
S
E
 
H
A
 
V
K
 
K
R
 
G
G
 
G
L
 
C
L
 
I
F
 
L
A
 
C
A
 
G
Y
 
Y
L
 
L
K
 
K
I
 
L
L
 
M
I
 
P
P
 
M
I
 
F
I
 
I
V
 
M
I
 
V
I
 
M
P
 
P
G
 
G
I
 
M
T
 
I
A
 
S
Y
 
R
V
 
I
I
 
L
H
 
Y
G
 
T
M
 
E
S
 
K
V
 
I
E
 
A
T
 
C
A
 
V
D
 
V
G
 
P
S
 
S
L
 
E
A
 
C
F
 
-
I
 
-
N
 
-
Q
 
-
M
 
-
G
 
-
D
 
-
S
 
E
T
 
K
L
 
Y
L
 
C
A
 
G
G
 
T
E
 
K
V
 
V
A
 
G
I
 
C
S
 
T
D
 
N
D
 
I
A
 
A
Y
 
Y
P
 
P
W
 
T
L
 
L
L
 
V
R
 
V
N
 
E
F
 
L
A
 
M
P
 
P
V
 
N
G
 
G
I
 
L
R
 
R
G
 
G
L
 
L
A
 
M
F
 
L
A
 
S
A
 
V
L
 
M
V
 
L
A
 
A
A
 
S
V
 
L
I
 
M
S
 
S
S
 
S
L
 
L
A
 
T
S
 
S
L
 
I
L
 
F
N
 
N
S
 
S
T
 
A
S
 
S
T
 
T
I
 
L
F
 
F
T
 
T
L
 
M
D
 
D
I
 
I
Y
 
Y
K
 
A
T
 
K
L
 
-
I
 
V
N
 
R
K
 
K
S
 
R
A
 
A
S
 
S
E
 
E
R
 
K
Q
 
E
L
 
L
V
 
M
R
 
I
V
 
A
G
 
G
R
 
R
F
 
L
A
 
F
A
 
I
F
 
L
V
 
V
A
 
L
L
 
I
A
 
G
I
 
I
A
 
S
I
 
I
V
 
-
A
 
A
A
 
W
R
 
V
P
 
P
L
 
I
L
 
V
G
 
Q
G
 
S
L
 
A
D
 
Q
-
 
S
-
 
G
Q
 
Q
A
 
L
F
|
F
Q
x
D
Y
 
Y
I
 
I
Q
|
Q
E
 
S
Y
 
I
T
 
T
G
 
S
F
 
Y
I
 
L
Y
 
G
P
 
P
G
 
P
V
 
I
V
 
A
A
 
A
V
 
V
F
 
F
G
 
L
M
 
L
G
 
A
I
 
I
L
 
F
W
 
W
K
 
K
R
 
R
A
 
V
T
 
N
N
 
E
R
 
P
A
 
G
A
 
A
L
 
F
W
 
W

Sites not aligning to the query:

P13866 Sodium/glucose cotransporter 1; Na(+)/glucose cotransporter 1; High affinity sodium-glucose cotransporter; Solute carrier family 5 member 1 from Homo sapiens (Human) (see 6 papers)
32% identity, 74% coverage: 9:473/631 of query aligns to 28:487/664 of P13866

query
sites
P13866
D
 
D
Y
 
I
L
 
S
I
 
I
F
 
I
G
 
V
A
 
I
Y
 
Y
A
 
F
A
 
V
L
 
V
I
 
V
M
 
M
G
 
A
I
 
V
G
 
G
L
 
L
W
 
W
-
 
A
I
 
M
S
 
F
R
 
S
T
 
T
K
x
N
K
 
R
G
 
G
E
 
-
E
 
-
K
 
-
D
 
T
S
 
V
K
 
G
D
 
G
Y
 
F
F
 
F
L
 
L
A
 
A
G
 
G
G
 
R
T
 
S
L
 
M
S
 
V
W
|
W
W
 
W
A
 
P
I
 
I
G
 
G
A
 
A
S
 
S
L
 
L
I
 
F
A
 
A
A
x
S
N
 
N
I
 
I
S
 
G
A
 
S
E
 
G
H
|
H
F
 
F
I
 
V
A
 
G
M
 
L
S
 
A
G
 
G
S
 
T
G
 
G
Y
 
A
A
 
A
I
 
S
G
 
G
L
 
I
G
 
A
M
 
I
A
 
G
A
 
G
Y
 
F
E
 
E
W
 
W
I
 
N
A
 
A
A
 
L
I
 
V
V
 
L
L
 
V
I
 
V
L
 
V
V
 
L
A
 
G
K
 
W
Y
 
L
L
 
F
L
 
V
P
 
P
Q
 
I
M
 
Y
L
 
I
D
 
K
K
 
A
K
 
G
I
 
V
F
 
V
T
 
T
M
 
M
P
 
P
Q
 
E
F
 
Y
A
 
L
R
 
R
E
 
K
R
|
R
Y
 
F
-
 
G
G
 
G
S
 
Q
G
 
R
V
 
I
S
 
Q
F
 
V
F
 
Y
F
 
L
S
 
S
F
 
L
F
 
L
W
 
S
L
 
L
L
 
L
V
 
L
Y
 
Y
V
 
I
F
 
F
V
 
T
N
 
K
L
 
I
T
x
S
S
 
A
V
 
D
A
 
I
W
 
F
L
 
S
G
 
G
A
|
A
L
 
I
A
 
F
M
 
I
N
 
N
Q
 
L
I
 
A
L
 
L
G
 
G
V
 
L
P
 
N
I
 
L
L
 
Y
Y
 
L
G
 
A
V
 
I
P
 
F
G
 
L
L
 
L
L
 
L
I
 
A
F
 
I
A
 
T
G
 
A
V
 
L
Y
|
Y
S
x
T
I
|
I
Y
x
T
G
|
G
G
|
G
M
x
L
K
x
A
S
x
A
V
|
V
A
x
I
W
x
Y
T
|
T
D
|
D
I
x
T
V
x
L
Q
|
Q
V
x
T
F
x
V
F
x
I
L
x
M
I
x
L
F
x
V
G
|
G
G
x
S
L
|
L
I
|
I
T
x
L
A
x
T
W
x
G
F
|
F
A
|
A
L
x
F
D
x
H
A
x
E
V
|
V
A
x
G
G
 
-
D
 
-
G
|
G
K
x
Y
S
x
D
A
|
A
F
|
F
-
x
M
E
|
E
G
x
K
F
x
Y
R
x
M
V
x
K
V
x
A
L
x
I
N
x
P
Q
x
T
I
|
I
R
 
-
A
x
V
S
|
S
E
x
D
T
x
G
D
x
N
T
|
T
H
x
T
F
|
F
N
x
Q
M
x
E
I
x
K
I
x
C
G
x
Y
D
x
T
S
x
P
E
x
R
G
x
A
T
x
D
-
x
S
-
x
F
-
x
H
-
x
I
-
x
F
R
|
R
D
|
D
S
x
P
F
x
L
L
x
T
-
x
G
N
x
D
L
|
L
P
|
P
G
x
W
L
x
P
A
x
G
V
x
F
I
|
I
F
|
F
G
|
G
A
x
M
M
x
S
W
x
I
L
|
L
T
|
T
N
 
-
I
x
L
G
x
W
Y
|
Y
W
|
W
G
x
C
F
x
T
N
x
D
Q
|
Q
F
x
V
I
|
I
I
x
V
Q
|
Q
K
x
R
G
x
C
L
|
L
A
x
S
A
|
A
K
|
K
N
|
N
L
x
M
K
x
S
E
x
H
A
x
V
K
|
K
R
x
G
G
|
G
L
x
C
L
x
I
F
x
L
A
x
C
A
x
G
Y
|
Y
L
|
L
K
|
K
I
x
L
L
x
M
I
x
P
P
x
M
I
x
F
I
|
I
V
x
M
I
x
V
I
x
M
P
|
P
G
|
G
I
x
M
T
x
I
A
x
S
Y
x
R
V
x
I
I
x
L
H
x
Y
G
 
-
M
 
-
S
 
-
V
 
-
E
 
-
T
 
-
A
 
-
D
x
T
G
x
E
S
x
K
L
x
I
A
|
A
F
x
C
I
x
V
N
x
V
Q
x
P
M
x
S
G
x
E
D
x
C
S
x
E
T
x
K
L
x
Y
L
x
C
A
x
G
G
x
T
E
x
K
V
|
V
A
x
G
I
x
C
S
x
T
D
x
N
D
x
I
A
|
A
Y
|
Y
P
|
P
W
x
T
L
|
L
L
x
V
R
x
V
N
x
E
F
x
L
A
x
M
P
|
P
V
x
N
G
|
G
I
x
L
R
|
R
G
|
G
L
|
L
A
x
M
F
x
L
A
x
S
A
x
V
L
x
M
V
x
L
A
|
A
A
x
S
V
x
L
I
x
M