SitesBLAST – Find functional sites

 

SitesBLAST

Comparing WP_110208549.1 NCBI__GCF_003194585.1:WP_110208549.1 to proteins with known functional sites using BLASTp with E ≤ 0.001.

Or try Sites on a Tree, PaperBLAST, Conserved Domains, or compare to all protein structures

Found 10 hits to proteins with known functional sites (download)

4jz8A Carbamate kinase from giardia lamblia bound to citric acid (see paper)
41% identity, 99% coverage: 3:311/312 of query aligns to 7:316/316 of 4jz8A

query
sites
4jz8A
V
 
V
L
 
V
M
 
I
A
 
A
L
 
L
G
|
G
G
|
G
N
|
N
A
 
A
M
 
M
T
 
L
N
 
Q
A
 
A
E
 
K
G
 
E
R
 
K
A
 
G
R
 
D
P
 
Y
E
 
D
D
 
T
Q
 
Q
I
 
R
A
 
K
A
 
N
A
 
V
E
 
E
T
 
I
A
 
A
M
 
A
A
 
S
A
 
E
V
 
I
A
 
Y
G
 
K
L
 
I
L
 
H
E
 
K
H
 
A
D
 
G
H
 
Y
D
 
K
V
 
V
V
 
V
V
 
L
T
 
T
H
 
S
G
|
G
N
 
N
G
|
G
P
|
P
Q
 
Q
V
 
V
G
 
G
N
 
A
L
 
I
L
 
K
V
 
L
K
 
Q
N
 
N
E
 
Q
L
 
A
A
 
A
A
 
A
Q
 
G
V
 
V
V
 
S
P
 
P
P
 
E
V
 
M
P
 
P
L
 
L
D
 
H
W
 
V
C
 
C
G
 
G
A
 
A
Q
 
M
T
 
S
Q
 
Q
A
 
G
T
 
F
L
 
I
G
 
G
L
 
Y
I
 
M
L
 
M
M
 
S
D
 
Q
A
 
A
L
 
M
D
 
D
A
 
N
E
 
V
L
 
F
A
 
C
R
 
A
R
 
N
H
 
N
V
 
E
S
 
P
R
 
A
R
 
N
T
 
C
A
 
V
T
 
T
L
 
C
V
 
V
T
 
T
R
 
Q
A
 
T
R
 
L
V
 
V
D
 
D
A
 
P
A
 
K
D
 
D
P
 
Q
G
 
A
F
 
F
T
 
T
H
 
N
P
 
P
T
 
T
K
|
K
P
 
P
I
 
V
G
 
G
R
 
R
H
 
F
L
 
Y
P
 
T
A
 
E
E
 
Q
E
 
E
A
 
A
Q
 
K
V
 
D
L
 
L
I
 
M
-
 
A
-
 
A
D
 
N
H
 
P
G
 
G
E
 
K
T
 
I
W
 
L
Q
 
R
D
 
E
M
 
D
G
 
A
A
 
G
K
 
R
G
 
G
W
 
W
R
 
R
R
 
V
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
R
P
 
P
L
 
L
E
 
E
I
 
I
I
 
V
D
 
E
A
 
Y
P
 
G
A
 
V
A
 
I
L
 
K
A
 
T
L
 
L
I
 
I
E
 
D
A
 
N
G
 
N
F
 
V
V
 
L
V
 
V
I
 
I
A
 
C
N
 
T
G
 
N
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
C
V
 
-
R
 
K
R
 
R
E
 
E
D
 
N
G
 
K
S
 
V
L
 
I
T
 
S
G
 
G
V
 
V
P
 
D
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
G
 
A
A
 
T
E
 
S
L
 
L
F
 
L
A
 
A
R
 
K
V
 
T
V
 
L
G
 
N
A
 
S
D
 
D
V
 
Y
L
 
L
V
 
M
I
 
I
A
 
L
T
 
T
D
 
D
V
 
V
P
 
L
Q
 
N
A
 
A
V
 
C
L
 
I
R
 
N
F
 
Y
G
 
K
T
 
K
P
 
P
E
 
D
A
 
E
E
 
R
P
 
K
V
 
L
G
 
E
E
 
E
V
 
I
T
 
K
L
 
L
S
 
S
Q
 
E
M
 
I
R
 
L
A
 
A
Y
 
L
A
 
E
A
 
K
E
 
D
G
 
G
H
 
H
F
 
F
G
 
A
S
 
A
G
 
G
S
 
S
M
 
M
G
 
G
P
 
P
K
|
K
V
 
V
D
 
R
A
 
A
V
 
A
C
 
I
R
 
E
F
 
F
V
 
T
E
 
Q
A
 
A
T
 
T
G
 
G
Q
 
K
V
 
M
G
 
S
I
 
I
I
 
I
T
 
T
S
 
S
L
 
L
S
 
S
A
 
T
I
 
A
T
 
V
D
 
D
A
 
A
V
 
L
H
 
N
G
 
G
Q
 
K
A
 
C
G
 
G
T
 
T
R
 
R
V
 
I
V
 
I
P
 
K
D
 
D

4jz7C Carbamate kinase from giardia lamblia bound to amp-pnp (see paper)
41% identity, 99% coverage: 3:311/312 of query aligns to 7:316/316 of 4jz7C

query
sites
4jz7C
V
 
V
L
 
V
M
 
I
A
 
A
L
 
L
G
 
G
G
|
G
N
|
N
A
 
A
M
 
M
T
 
L
N
 
Q
A
 
A
E
 
K
G
 
E
R
 
K
A
 
G
R
 
D
P
 
Y
E
 
D
D
 
T
Q
 
Q
I
 
R
A
 
K
A
 
N
A
 
V
E
 
E
T
 
I
A
 
A
M
 
A
A
 
S
A
 
E
V
 
I
A
 
Y
G
 
K
L
 
I
L
 
H
E
 
K
H
 
A
D
 
G
H
 
Y
D
 
K
V
 
V
V
 
V
V
 
L
T
 
T
H
 
S
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
N
 
A
L
 
I
L
 
K
V
 
L
K
 
Q
N
 
N
E
 
Q
L
 
A
A
 
A
A
 
A
Q
 
G
V
 
V
V
 
S
P
 
P
P
 
E
V
 
M
P
 
P
L
 
L
D
 
H
W
 
V
C
 
C
G
 
G
A
 
A
Q
 
M
T
 
S
Q
 
Q
A
 
G
T
 
F
L
 
I
G
 
G
L
 
Y
I
 
M
L
 
M
M
 
S
D
 
Q
A
 
A
L
 
M
D
 
D
A
 
N
E
 
V
L
 
F
A
 
C
R
 
A
R
 
N
H
 
N
V
 
E
S
 
P
R
 
A
R
 
N
T
 
C
A
 
V
T
 
T
L
 
C
V
 
V
T
 
T
R
 
Q
A
 
T
R
 
L
V
 
V
D
 
D
A
 
P
A
 
K
D
 
D
P
 
Q
G
 
A
F
 
F
T
 
T
H
 
N
P
 
P
T
 
T
K
|
K
P
 
P
I
 
V
G
 
G
R
 
R
H
 
F
L
 
Y
P
 
T
A
 
E
E
 
Q
E
 
E
A
 
A
Q
 
K
V
 
D
L
 
L
I
 
M
-
 
A
-
 
A
D
 
N
H
 
P
G
 
G
E
 
K
T
 
I
W
 
L
Q
 
R
D
 
E
M
 
D
G
 
A
A
 
G
K
 
R
G
 
G
W
 
W
R
 
R
R
 
V
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
R
P
 
P
L
 
L
E
 
E
I
 
I
I
 
V
D
 
E
A
 
Y
P
 
G
A
 
V
A
 
I
L
 
K
A
 
T
L
 
L
I
 
I
E
 
D
A
 
N
G
 
N
F
 
V
V
 
L
V
 
V
I
 
I
A
 
C
N
 
T
G
 
N
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
C
V
 
-
R
 
K
R
 
R
E
 
E
D
 
N
G
 
K
S
 
V
L
 
I
T
 
S
G
 
G
V
 
V
P
 
D
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
G
 
A
A
 
T
E
 
S
L
 
L
F
 
L
A
 
A
R
 
K
V
 
T
V
 
L
G
 
N
A
 
S
D
 
D
V
 
Y
L
 
L
V
 
M
I
 
I
A
 
L
T
|
T
D
|
D
V
 
V
P
 
L
Q
 
N
A
 
A
V
x
C
L
 
I
R
 
N
F
x
Y
G
 
K
T
 
K
P
 
P
E
 
D
A
 
E
E
 
R
P
 
K
V
 
L
G
 
E
E
 
E
V
 
I
T
 
K
L
 
L
S
 
S
Q
 
E
M
 
I
R
 
L
A
 
A
Y
 
L
A
 
E
A
 
K
E
 
D
G
 
G
H
 
H
F
 
F
G
 
A
S
 
A
G
 
G
S
|
S
M
|
M
G
 
G
P
 
P
K
|
K
V
 
V
D
 
R
A
 
A
V
 
A
C
 
I
R
 
E
F
 
F
V
 
T
E
 
Q
A
 
A
T
 
T
G
 
G
Q
 
K
V
 
M
G
 
S
I
 
I
I
 
I
T
 
T
S
 
S
L
 
L
S
 
S
A
 
T
I
 
A
T
 
V
D
 
D
A
 
A
V
 
L
H
 
N
G
 
G
Q
 
K
A
 
C
G
 
G
T
 
T
R
 
R
V
 
I
V
 
I
P
 
K
D
 
D

1e19A Structure of the carbamate kinase-like carbamoyl phosphate synthetase from the hyperthermophilic archaeon pyrococcus furiosus bound to adp (see paper)
41% identity, 99% coverage: 2:310/312 of query aligns to 3:313/313 of 1e19A

query
sites
1e19A
R
 
R
V
 
V
L
 
V
M
 
I
A
 
A
L
 
L
G
 
G
G
|
G
N
|
N
A
 
A
M
 
L
T
 
Q
N
 
Q
A
 
R
E
 
G
G
 
Q
R
 
K
A
 
G
R
 
S
P
 
Y
E
 
E
D
 
E
Q
 
M
I
 
M
A
 
D
A
 
N
A
 
V
E
 
R
T
 
K
A
 
T
M
 
A
A
 
R
A
 
Q
V
 
I
A
 
A
G
 
E
L
 
I
L
 
I
E
 
A
H
 
R
D
 
G
H
 
Y
D
 
E
V
 
V
V
 
V
V
 
I
T
 
T
H
 
H
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
N
 
S
L
 
L
L
 
L
V
 
L
K
 
H
N
 
M
E
 
D
-
 
A
-
 
G
L
 
Q
A
 
A
A
 
T
Q
 
Y
V
 
G
V
 
I
P
 
P
P
 
A
V
 
Q
P
 
P
L
 
M
D
 
D
W
 
V
C
 
A
G
 
G
A
 
A
Q
 
M
T
 
S
Q
 
Q
A
 
G
T
 
W
L
 
I
G
 
G
L
 
Y
I
 
M
L
 
I
M
 
Q
D
 
Q
A
 
A
L
 
L
D
 
K
A
 
N
E
 
E
L
 
L
A
 
R
R
 
K
R
 
R
H
 
G
V
 
M
S
 
E
R
 
K
R
 
K
T
 
V
A
 
V
T
 
T
L
 
I
V
 
I
T
 
T
R
 
Q
A
 
T
R
 
I
V
 
V
D
 
D
A
 
K
A
 
N
D
 
D
P
 
P
G
 
A
F
 
F
T
 
Q
H
 
N
P
 
P
T
 
T
K
|
K
P
 
P
I
 
V
G
 
G
R
 
P
H
 
F
L
 
Y
P
 
D
A
 
E
E
 
E
E
 
T
A
 
A
Q
 
K
V
 
R
L
 
L
I
 
A
-
 
R
D
 
E
H
 
K
G
 
G
E
 
W
T
 
I
W
 
V
Q
 
K
D
 
E
M
 
D
G
 
S
A
 
G
K
 
R
G
 
G
W
 
W
R
 
R
R
 
R
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
D
P
 
P
L
 
K
E
 
G
I
 
H
I
 
V
D
 
E
A
 
A
P
 
E
A
 
T
A
 
I
L
 
K
A
 
K
L
 
L
I
 
V
E
 
E
A
 
R
G
 
G
F
 
V
V
 
I
V
 
V
I
 
I
A
 
A
N
 
S
G
 
G
G
 
G
G
 
G
G
 
G
I
 
V
P
 
P
V
 
V
V
 
I
R
 
L
R
 
-
E
 
E
D
 
D
G
 
G
S
 
E
L
 
I
T
 
K
G
 
G
V
 
V
P
 
E
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
G
 
A
A
 
G
E
 
E
L
 
K
F
 
L
A
 
A
R
 
E
V
 
E
V
 
V
G
 
N
A
 
A
D
 
D
V
 
I
L
 
F
V
 
M
I
 
I
A
 
L
T
|
T
D
|
D
V
|
V
P
 
N
Q
 
G
A
 
A
V
x
A
L
 
L
R
 
Y
F
x
Y
G
 
G
T
 
T
P
 
E
E
 
K
A
 
E
E
 
Q
P
 
W
V
 
L
G
 
R
E
 
E
V
 
V
T
 
K
L
 
V
S
 
E
Q
 
E
M
 
L
R
 
R
A
 
K
Y
 
Y
A
 
Y
A
 
E
E
 
E
G
 
G
H
 
H
F
 
F
G
x
K
S
 
A
G
 
G
S
|
S
M
|
M
G
 
G
P
 
P
K
|
K
V
 
V
D
 
L
A
 
A
V
 
A
C
 
I
R
 
R
F
 
F
V
 
I
E
 
E
A
 
W
T
 
G
G
 
G
Q
 
E
V
 
R
G
 
A
I
 
I
I
 
I
T
 
A
S
 
H
L
 
L
S
 
E
A
 
K
I
 
A
T
 
V
D
 
E
A
 
A
V
 
L
H
 
E
G
 
G
Q
 
K
A
 
T
G
 
G
T
 
T
R
 
Q
V
 
V
V
 
L
P
 
P

4olcA Carbamate kinase from giardia lamblia thiocarbamoylated by disulfiram on cys242 (see paper)
41% identity, 99% coverage: 3:311/312 of query aligns to 6:308/308 of 4olcA

query
sites
4olcA
V
 
V
L
 
V
M
 
I
A
 
A
L
 
L
G
 
G
G
|
G
N
|
N
A
 
A
M
 
M
T
 
L
N
 
Q
A
 
A
E
 
K
G
 
E
R
 
K
A
 
G
R
 
D
P
 
Y
E
 
D
D
 
T
Q
 
Q
I
 
R
A
 
K
A
 
N
A
 
V
E
 
E
T
 
I
A
 
A
M
 
A
A
 
S
A
 
E
V
 
I
A
 
Y
G
 
K
L
 
I
L
 
H
E
 
K
H
 
A
D
 
G
H
 
Y
D
 
K
V
 
V
V
 
V
V
 
L
T
 
T
H
 
S
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
N
 
A
L
 
I
L
 
K
V
 
L
K
 
Q
N
 
N
E
 
Q
L
 
A
A
 
A
A
 
A
Q
 
G
V
 
V
V
 
S
P
 
P
P
 
E
V
 
M
P
 
P
L
 
L
D
 
H
W
 
V
C
 
C
G
 
G
A
 
A
Q
 
M
T
 
S
Q
 
Q
A
 
G
T
 
F
L
 
I
G
 
G
L
 
Y
I
 
M
L
 
M
M
 
S
D
 
Q
A
 
A
L
 
M
D
 
D
A
 
N
E
 
V
L
 
F
A
 
C
R
 
A
R
 
N
H
 
N
V
 
E
S
 
P
R
 
A
R
 
N
T
 
C
A
 
V
T
 
T
L
 
C
V
 
V
T
 
T
R
 
Q
A
 
T
R
 
L
V
 
V
D
 
D
A
 
P
A
 
K
D
 
D
P
 
Q
G
 
A
F
 
F
T
 
T
H
 
N
P
 
P
T
 
T
K
|
K
P
 
P
I
 
V
G
 
G
R
 
R
H
 
F
L
 
Y
P
 
T
A
 
E
E
 
Q
E
 
E
A
 
A
Q
 
K
V
 
D
L
 
L
I
 
M
-
 
A
-
 
A
D
 
N
H
 
P
G
 
G
E
 
K
T
 
I
W
 
L
Q
 
R
D
 
E
M
 
D
G
 
A
A
 
G
K
 
R
G
 
G
W
 
W
R
 
R
R
 
V
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
R
P
 
P
L
 
L
E
 
E
I
 
I
I
 
V
D
 
E
A
 
Y
P
 
G
A
 
V
A
 
I
L
 
K
A
 
T
L
 
L
I
 
I
E
 
D
A
 
N
G
 
N
F
 
V
V
 
L
V
 
V
I
 
I
A
 
C
N
 
T
G
 
N
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
-
V
 
C
R
 
K
R
 
R
E
 
E
D
 
N
G
 
K
S
 
V
L
 
I
T
 
S
G
 
G
V
 
V
P
 
D
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
G
 
A
A
 
T
E
 
S
L
 
L
F
 
L
A
 
A
R
 
K
V
 
T
V
 
L
G
 
N
A
 
S
D
 
D
V
 
Y
L
 
L
V
 
M
I
 
I
A
 
L
T
 
T
D
|
D
V
 
V
P
x
L
Q
 
N
A
 
A
V
 
C
L
 
I
R
 
R
F
 
-
G
 
-
T
 
-
P
 
-
E
 
-
A
 
-
E
 
-
P
 
K
V
 
L
G
 
E
E
 
E
V
 
I
T
 
K
L
 
L
S
 
S
Q
 
E
M
 
I
R
 
L
A
 
A
Y
 
L
A
 
E
A
 
K
E
 
D
G
 
G
H
 
H
F
 
F
G
 
A
S
 
A
G
 
G
S
 
S
M
 
M
G
 
G
P
 
P
K
|
K
V
 
V
D
 
R
A
 
A
V
 
A
C
 
I
R
 
E
F
 
F
V
 
T
E
 
Q
A
 
A
T
 
T
G
 
G
Q
 
K
V
 
M
G
 
S
I
 
I
I
 
I
T
 
T
S
 
S
L
 
L
S
|
S
A
 
T
I
 
A
T
 
V
D
 
D
A
 
A
V
 
L
H
 
N
G
 
G
Q
 
K
A
 
C
G
 
G
T
 
T
R
 
R
V
 
I
V
 
I
P
 
K
D
 
D

P0A2X8 Carbamate kinase 1; EC 2.7.2.2 from Enterococcus faecium (Streptococcus faecium) (see 2 papers)
41% identity, 95% coverage: 2:296/312 of query aligns to 4:295/310 of P0A2X8

query
sites
P0A2X8
R
 
K
V
 
M
L
 
V
M
 
V
A
 
A
L
 
L
G
 
G
G
 
G
N
 
N
A
 
A
M
 
I
T
 
L
N
 
S
A
 
N
E
 
D
G
 
A
R
 
S
A
 
A
R
 
H
P
 
A
E
 
Q
D
 
Q
Q
 
Q
I
 
-
A
 
A
A
 
L
A
 
V
E
 
Q
T
 
T
A
 
S
M
 
-
A
 
A
A
 
Y
V
 
L
A
 
V
G
 
H
L
 
L
L
 
I
E
 
K
H
 
Q
D
 
G
H
 
H
D
 
R
V
 
L
V
 
I
V
 
V
T
 
S
H
 
H
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
N
 
N
L
 
L
L
 
L
V
 
L
K
 
Q
N
 
Q
E
 
Q
L
 
A
A
 
A
-
 
D
A
 
S
Q
 
E
V
 
K
V
 
N
P
 
P
P
 
A
V
 
M
P
 
P
L
 
L
D
 
D
W
 
T
C
 
C
G
 
V
A
 
A
Q
 
M
T
 
T
Q
 
Q
A
 
G
T
 
S
L
 
I
G
 
G
L
 
Y
I
 
W
L
 
L
M
 
S
D
 
N
A
 
A
L
 
L
D
 
N
A
 
Q
E
 
E
L
 
L
A
 
N
R
 
K
R
 
A
H
 
G
V
 
I
S
 
K
R
 
K
R
 
Q
T
 
V
A
 
A
T
 
T
L
 
V
V
 
L
T
 
T
R
 
Q
A
 
V
R
 
V
V
 
V
D
 
D
A
 
P
A
 
A
D
 
D
P
 
E
G
 
A
F
 
F
T
 
K
H
 
N
P
 
P
T
 
T
K
 
K
P
 
P
I
 
I
G
 
G
R
 
P
H
 
F
L
 
L
P
 
T
A
x
E
E
 
A
E
|
E
A
 
A
Q
x
K
V
x
E
L
 
A
I
 
M
D
 
Q
H
 
A
G
 
G
E
 
A
T
 
I
W
 
F
Q
 
K
D
 
E
M
 
D
G
 
A
A
 
G
K
 
R
G
 
G
W
 
W
R
 
R
R
 
K
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
K
P
 
P
L
 
I
E
 
D
I
 
I
I
 
H
D
 
E
A
 
A
P
 
E
A
 
T
A
 
I
L
 
N
A
 
T
L
 
L
I
 
I
E
 
K
A
 
N
G
 
D
F
 
I
V
 
I
V
 
T
I
 
I
A
 
S
N
 
C
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
V
V
 
V
R
 
G
R
 
Q
E
 
E
D
 
-
G
 
-
S
 
-
L
 
L
T
 
K
G
 
G
V
 
V
P
 
E
A
 
A
V
 
V
I
 
I
D
|
D
K
 
K
D
|
D
L
 
F
G
 
A
A
 
S
E
 
E
L
 
K
F
 
L
A
 
A
R
 
E
V
 
L
V
 
V
G
 
D
A
 
A
D
 
D
V
 
A
L
 
L
V
 
V
I
 
I
A
 
L
T
 
T
D
 
G
V
 
V
P
 
D
Q
 
Y
A
 
V
V
 
C
L
 
I
R
 
N
F
 
Y
G
 
G
T
 
K
P
 
P
E
 
D
A
 
E
E
 
K
P
 
Q
V
 
L
G
 
T
E
 
N
V
 
V
T
 
T
L
 
V
S
 
A
Q
 
E
M
 
L
R
 
E
A
 
E
Y
 
Y
A
 
K
A
 
Q
E
 
A
G
 
G
H
 
H
F
 
F
G
 
A
S
 
P
G
 
G
S
 
S
M
 
M
G
 
L
P
 
P
K
 
K
V
 
I
D
 
E
A
 
A
V
 
A
C
 
I
R
 
Q
F
 
F
V
 
V
E
 
E
A
 
S
T
 
Q
-
 
P
G
 
N
Q
 
K
V
 
Q
G
 
A
I
 
I
I
 
I
T
 
T
S
 
S
L
 
L
S
 
E
A
 
N
I
 
L

Sites not aligning to the query:

2we5A Carbamate kinase from enterococcus faecalis bound to mgadp (see paper)
41% identity, 95% coverage: 2:296/312 of query aligns to 3:294/309 of 2we5A

query
sites
2we5A
R
 
K
V
 
M
L
 
V
M
 
V
A
 
A
L
 
L
G
|
G
G
|
G
N
|
N
A
 
A
M
 
I
T
 
L
N
 
S
A
 
N
E
 
D
G
 
A
R
 
S
A
 
A
R
 
H
P
 
A
E
 
Q
D
 
Q
Q
 
Q
I
 
-
A
 
A
A
 
L
A
 
V
E
 
Q
T
 
T
A
 
S
M
 
-
A
 
A
A
 
Y
V
 
L
A
 
V
G
 
H
L
 
L
L
 
I
E
 
K
H
 
Q
D
 
G
H
 
H
D
 
R
V
 
L
V
 
I
V
 
V
T
 
S
H
 
H
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
N
 
N
L
 
L
L
 
L
V
 
L
K
 
Q
N
 
Q
E
 
Q
L
 
A
A
 
A
-
 
D
A
 
S
Q
 
E
V
 
K
V
 
N
P
 
P
P
 
A
V
 
M
P
 
P
L
 
L
D
 
D
W
 
T
C
 
C
G
 
V
A
 
A
Q
 
M
T
 
T
Q
 
Q
A
 
G
T
 
S
L
 
I
G
 
G
L
 
Y
I
 
W
L
 
L
M
 
S
D
 
N
A
 
A
L
 
L
D
 
N
A
 
Q
E
 
E
L
 
L
A
 
N
R
 
K
R
 
A
H
 
G
V
 
I
S
 
K
R
 
K
R
 
Q
T
 
V
A
 
A
T
 
T
L
 
V
V
 
L
T
 
T
R
 
Q
A
 
V
R
 
V
V
 
V
D
 
D
A
 
P
A
 
A
D
 
D
P
 
E
G
 
A
F
 
F
T
 
K
H
 
N
P
 
P
T
 
T
K
|
K
P
 
P
I
 
I
G
 
G
R
 
P
H
 
F
L
 
L
P
 
T
A
 
E
E
 
A
E
 
E
A
 
A
Q
 
K
V
 
E
L
 
A
I
 
M
D
 
Q
H
 
A
G
 
G
E
 
A
T
 
I
W
 
F
Q
 
K
D
 
E
M
 
D
G
 
A
A
 
G
K
 
R
G
 
G
W
 
W
R
 
R
R
 
K
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
K
P
 
P
L
 
I
E
 
D
I
 
I
I
 
H
D
 
E
A
 
A
P
 
E
A
 
T
A
 
I
L
 
N
A
 
T
L
 
L
I
 
I
E
 
K
A
 
N
G
 
D
F
 
I
V
 
I
V
 
T
I
 
I
A
 
S
N
 
C
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
V
V
 
V
R
 
G
R
 
Q
E
 
E
D
 
-
G
 
-
S
 
-
L
 
L
T
 
K
G
 
G
V
 
V
P
 
E
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
F
G
 
A
A
 
S
E
 
E
L
 
K
F
 
L
A
 
A
R
 
E
V
 
L
V
 
V
G
 
D
A
 
A
D
 
D
V
 
A
L
 
L
V
 
V
I
 
I
A
 
L
T
|
T
D
x
G
V
|
V
P
 
D
Q
 
Y
A
x
V
V
x
C
L
 
I
R
 
N
F
x
Y
G
 
G
T
 
K
P
 
P
E
 
D
A
 
E
E
 
K
P
 
Q
V
 
L
G
 
T
E
 
N
V
 
V
T
 
T
L
 
V
S
 
A
Q
 
E
M
 
L
R
 
E
A
 
E
Y
 
Y
A
 
K
A
 
Q
E
 
A
G
 
G
H
 
H
F
 
F
G
x
A
S
 
P
G
 
G
S
|
S
M
|
M
G
 
L
P
 
P
K
|
K
V
 
I
D
 
E
A
 
A
V
 
A
C
 
I
R
 
Q
F
 
F
V
 
V
E
 
E
A
 
S
T
 
Q
-
 
P
G
 
N
Q
 
K
V
 
Q
G
 
A
I
 
I
I
 
I
T
 
T
S
 
S
L
 
L
S
 
E
A
 
N
I
 
L

2we4A Carbamate kinase from enterococcus faecalis bound to a sulfate ion and two water molecules, which mimic the substrate carbamyl phosphate (see paper)
41% identity, 95% coverage: 2:296/312 of query aligns to 3:294/309 of 2we4A

query
sites
2we4A
R
x
K
V
 
M
L
 
V
M
 
V
A
 
A
L
 
L
G
|
G
G
|
G
N
|
N
A
 
A
M
 
I
T
 
L
N
 
S
A
 
N
E
 
D
G
 
A
R
 
S
A
 
A
R
 
H
P
 
A
E
 
Q
D
 
Q
Q
 
Q
I
 
-
A
 
A
A
 
L
A
 
V
E
 
Q
T
 
T
A
 
S
M
 
-
A
 
A
A
 
Y
V
 
L
A
 
V
G
 
H
L
 
L
L
 
I
E
 
K
H
 
Q
D
 
G
H
 
H
D
x
R
V
 
L
V
 
I
V
 
V
T
 
S
H
 
H
G
|
G
N
 
N
G
|
G
P
 
P
Q
 
Q
V
 
V
G
 
G
N
 
N
L
 
L
L
 
L
V
 
L
K
 
Q
N
 
Q
E
 
Q
L
 
A
A
 
A
-
 
D
A
 
S
Q
 
E
V
 
K
V
 
N
P
 
P
P
 
A
V
 
M
P
 
P
L
 
L
D
 
D
W
 
T
C
 
C
G
 
V
A
 
A
Q
 
M
T
 
T
Q
 
Q
A
 
G
T
 
S
L
 
I
G
 
G
L
 
Y
I
 
W
L
 
L
M
 
S
D
 
N
A
 
A
L
 
L
D
 
N
A
 
Q
E
 
E
L
 
L
A
 
N
R
 
K
R
 
A
H
 
G
V
 
I
S
 
K
R
 
K
R
 
Q
T
 
V
A
 
A
T
 
T
L
 
V
V
 
L
T
 
T
R
 
Q
A
 
V
R
 
V
V
 
V
D
 
D
A
 
P
A
 
A
D
 
D
P
 
E
G
 
A
F
 
F
T
 
K
H
 
N
P
 
P
T
 
T
K
|
K
P
 
P
I
 
I
G
 
G
R
 
P
H
 
F
L
 
L
P
 
T
A
 
E
E
 
A
E
 
E
A
 
A
Q
 
K
V
 
E
L
 
A
I
 
M
D
 
Q
H
 
A
G
 
G
E
 
A
T
 
I
W
 
F
Q
 
K
D
 
E
M
 
D
G
 
A
A
 
G
K
 
R
G
 
G
W
 
W
R
 
R
R
 
K
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
K
P
 
P
L
 
I
E
 
D
I
 
I
I
 
H
D
 
E
A
 
A
P
 
E
A
 
T
A
 
I
L
 
N
A
 
T
L
 
L
I
 
I
E
 
K
A
 
N
G
 
D
F
 
I
V
 
I
V
 
T
I
 
I
A
 
S
N
 
C
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
V
V
 
V
R
 
G
R
 
Q
E
 
E
D
 
-
G
 
-
S
 
-
L
 
L
T
 
K
G
 
G
V
 
V
P
 
E
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
F
G
 
A
A
 
S
E
 
E
L
 
K
F
 
L
A
 
A
R
 
E
V
 
L
V
 
V
G
 
D
A
 
A
D
 
D
V
 
A
L
 
L
V
 
V
I
 
I
A
 
L
T
 
T
D
 
G
V
 
V
P
 
D
Q
 
Y
A
 
V
V
 
C
L
x
I
R
x
N
F
 
Y
G
 
G
T
 
K
P
 
P
E
 
D
A
 
E
E
 
K
P
 
Q
V
 
L
G
 
T
E
 
N
V
 
V
T
 
T
L
 
V
S
 
A
Q
 
E
M
 
L
R
 
E
A
 
E
Y
 
Y
A
 
K
A
 
Q
E
 
A
G
 
G
H
|
H
F
|
F
G
 
A
S
 
P
G
 
G
S
 
S
M
 
M
G
 
L
P
 
P
K
|
K
V
 
I
D
 
E
A
 
A
V
 
A
C
 
I
R
 
Q
F
 
F
V
 
V
E
 
E
A
 
S
T
 
Q
-
 
P
G
 
N
Q
 
K
V
 
Q
G
 
A
I
 
I
I
 
I
T
 
T
S
 
S
L
 
L
S
 
E
A
 
N
I
 
L

4jz7A Carbamate kinase from giardia lamblia bound to amp-pnp (see paper)
38% identity, 99% coverage: 3:311/312 of query aligns to 7:285/285 of 4jz7A

query
sites
4jz7A
V
 
V
L
 
V
M
 
I
A
 
A
L
 
L
G
|
G
G
|
G
N
|
N
A
 
A
M
 
M
T
 
L
N
 
Q
A
 
A
E
 
K
G
 
E
R
 
K
A
 
G
R
 
D
P
 
Y
E
 
D
D
 
T
Q
 
Q
I
 
R
A
 
K
A
 
N
A
 
V
E
 
E
T
 
I
A
 
A
M
 
A
A
 
S
A
 
E
V
 
I
A
 
Y
G
 
K
L
 
I
L
 
H
E
 
K
H
 
A
D
 
G
H
 
Y
D
 
K
V
 
V
V
 
V
V
 
L
T
 
T
H
 
S
G
 
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
N
 
A
L
 
I
L
 
K
V
 
L
K
 
Q
N
 
N
E
 
Q
L
 
A
A
 
A
A
 
A
Q
 
G
V
 
V
V
 
S
P
 
P
P
 
E
V
 
M
P
 
P
L
 
L
D
 
H
W
 
V
C
 
C
G
 
G
A
 
A
Q
 
M
T
 
S
Q
 
Q
A
 
G
T
 
F
L
 
I
G
 
G
L
 
Y
I
 
M
L
 
M
M
 
S
D
 
Q
A
 
A
L
 
M
D
 
D
A
 
N
E
 
V
L
 
F
A
 
C
R
 
A
R
 
N
H
 
N
V
 
E
S
 
P
R
 
A
R
 
N
T
 
C
A
 
V
T
 
T
L
 
C
V
 
V
T
 
T
R
 
Q
A
 
T
R
 
L
V
 
V
D
 
D
A
 
P
A
 
K
D
 
D
P
 
Q
G
 
A
F
 
F
T
 
T
H
 
N
P
 
P
T
 
T
K
|
K
P
 
P
I
 
V
G
 
-
R
 
-
H
 
-
L
 
-
P
 
-
A
 
-
E
 
-
E
 
-
A
 
-
Q
 
-
V
 
-
L
 
-
I
 
-
D
 
-
H
 
-
G
 
-
E
 
-
T
 
-
W
 
-
Q
 
-
D
 
-
M
 
-
G
 
-
A
 
-
K
 
-
G
 
-
W
 
-
R
 
-
R
 
-
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
R
P
 
P
L
 
L
E
 
E
I
 
I
I
 
V
D
 
E
A
 
Y
P
 
G
A
 
V
A
 
I
L
 
K
A
 
T
L
 
L
I
 
I
E
 
D
A
 
N
G
 
N
F
 
V
V
 
L
V
 
V
I
 
I
A
 
C
N
 
T
G
 
N
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
C
V
 
-
R
 
K
R
 
R
E
 
E
D
 
N
G
 
K
S
 
V
L
 
I
T
 
S
G
 
G
V
 
V
P
 
D
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
G
 
A
A
 
T
E
 
S
L
 
L
F
 
L
A
 
A
R
 
K
V
 
T
V
 
L
G
 
N
A
 
S
D
 
D
V
 
Y
L
 
L
V
 
M
I
 
I
A
 
L
T
|
T
D
|
D
V
 
V
P
 
L
Q
 
N
A
 
A
V
x
C
L
 
I
R
 
N
F
x
Y
G
 
K
T
 
K
P
 
P
E
 
D
A
 
E
E
 
R
P
 
K
V
 
L
G
 
E
E
 
E
V
 
I
T
 
K
L
 
L
S
 
S
Q
 
E
M
 
I
R
 
L
A
 
A
Y
 
L
A
 
E
A
 
K
E
 
D
G
 
G
H
 
H
F
 
F
G
x
A
S
 
A
G
 
G
S
|
S
M
|
M
G
 
G
P
 
P
K
|
K
V
 
V
D
 
R
A
 
A
V
 
A
C
 
I
R
 
E
F
 
F
V
 
T
E
 
Q
A
 
A
T
 
T
G
 
G
Q
 
K
V
 
M
G
 
S
I
 
I
I
 
I
T
 
T
S
 
S
L
 
L
S
 
S
A
 
T
I
 
A
T
 
V
D
 
D
A
 
A
V
 
L
H
 
N
G
 
G
Q
 
K
A
 
C
G
 
G
T
 
T
R
 
R
V
 
I
V
 
I
P
 
K
D
 
D

8crvA Crystal structure of the carbamate kinase from pseudomonas aeruginosa
39% identity, 99% coverage: 1:308/312 of query aligns to 3:302/312 of 8crvA

query
sites
8crvA
M
 
M
R
 
R
V
 
I
L
 
V
M
 
V
A
 
A
L
 
L
G
 
G
G
|
G
N
 
N
A
 
A
M
 
L
T
 
L
N
 
R
-
 
R
-
 
G
-
 
E
-
 
P
-
 
M
A
 
T
E
 
A
G
 
D
R
 
N
A
 
Q
R
 
R
P
 
E
E
 
N
D
 
V
Q
 
R
I
 
I
A
 
A
A
 
A
A
 
E
E
 
Q
T
 
I
A
 
A
M
 
K
A
 
V
A
 
A
V
 
P
A
 
G
G
 
-
L
 
-
L
 
-
E
 
-
H
 
-
D
 
-
H
 
N
D
 
E
V
 
L
V
 
V
V
 
I
T
 
A
H
 
H
G
|
G
N
|
N
G
|
G
P
 
P
Q
 
Q
V
 
V
G
 
G
N
 
-
L
 
L
L
 
L
V
 
A
K
 
L
N
 
Q
E
 
G
L
 
A
A
 
A
A
 
Y
Q
 
D
V
 
K
V
 
V
P
 
S
P
 
P
V
 
Y
P
 
P
L
 
L
D
 
D
W
 
V
C
 
L
G
 
G
A
 
A
Q
 
E
T
 
T
Q
 
E
A
 
G
T
 
M
L
 
I
G
 
G
L
 
Y
I
 
M
L
 
I
M
 
E
D
 
Q
A
 
E
L
 
M
D
 
G
A
 
N
E
 
L
L
 
L
A
 
P
R
 
-
R
 
-
H
 
-
V
 
F
S
 
E
R
 
V
R
 
P
T
 
F
A
 
A
T
 
T
L
 
I
V
 
L
T
 
T
R
 
Q
A
 
V
R
 
E
V
 
V
D
 
D
A
 
G
A
 
K
D
 
D
P
 
P
G
 
A
F
 
F
T
 
Q
H
 
N
P
 
P
T
 
T
K
 
K
P
 
P
I
 
I
G
 
G
R
 
P
H
 
V
L
 
Y
P
 
S
A
 
R
E
 
E
E
 
E
A
 
A
Q
 
E
V
 
R
L
 
L
I
 
A
-
 
A
D
 
E
H
 
K
G
 
G
E
 
W
T
 
S
W
 
I
Q
 
T
D
 
P
M
 
D
G
 
G
A
 
D
K
 
K
G
 
-
W
 
F
R
 
R
R
 
R
V
 
V
V
 
V
A
 
P
S
 
S
P
 
P
A
 
R
P
 
P
L
 
K
E
 
R
I
 
I
I
 
F
D
 
E
A
 
I
P
 
R
A
 
P
A
 
V
L
 
K
A
 
W
L
 
L
I
 
L
E
 
E
A
 
K
G
 
G
F
 
T
V
 
I
V
 
V
I
 
I
A
 
C
N
 
A
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
T
V
 
M
R
 
Y
R
 
D
E
 
E
D
 
A
G
 
G
S
 
K
-
 
K
L
 
L
T
 
S
G
 
G
V
 
V
P
 
E
A
 
A
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
L
G
 
C
A
 
S
E
 
S
L
 
L
F
 
L
A
 
A
R
 
Q
V
 
E
V
 
L
G
 
V
A
 
A
D
 
D
V
 
I
L
 
L
V
 
I
I
 
I
A
 
A
T
 
T
D
 
D
V
 
V
P
 
D
Q
 
A
A
 
A
V
 
Y
L
 
V
R
 
D
F
 
W
G
 
G
T
 
K
P
 
P
E
 
T
A
 
Q
E
 
K
P
 
A
V
 
I
G
 
A
E
 
Q
V
 
A
T
 
H
L
 
P
S
 
D
Q
 
E
M
 
L
R
 
E
A
 
R
Y
 
L
A
 
G
A
 
-
E
 
-
G
 
-
H
 
-
F
 
F
G
 
A
S
 
A
G
 
G
S
 
S
M
 
M
G
 
G
P
 
P
K
 
K
V
 
V
D
 
Q
A
 
A
V
 
A
C
 
I
R
 
E
F
 
F
V
 
A
E
 
R
A
 
A
T
 
T
G
 
G
Q
 
K
V
 
D
G
 
A
I
 
V
I
 
I
T
 
G
S
 
S
L
 
L
S
 
A
A
 
D
I
 
I
T
 
V
D
 
A
A
 
I
V
 
T
H
 
E
G
 
G
Q
 
K
A
 
A
G
 
G
T
 
T
R
 
R
V
 
V

4axsA Structure of carbamate kinase from mycoplasma penetrans (see paper)
31% identity, 99% coverage: 2:309/312 of query aligns to 1:290/291 of 4axsA

query
sites
4axsA
R
 
R
V
 
I
L
 
V
M
 
I
A
 
A
L
 
L
G
 
G
G
|
G
N
|
N
A
 
A
M
 
L
T
 
G
N
 
D
A
 
-
E
 
-
G
 
-
R
 
-
A
 
-
R
 
N
P
 
P
E
 
S
D
 
Q
Q
 
Q
I
 
K
A
 
E
A
 
L
A
 
V
E
 
K
T
 
I
A
 
P
M
 
A
A
 
A
A
 
K
V
 
I
A
 
A
G
 
A
L
 
L
L
 
I
E
 
Q
H
 
E
D
 
G
H
 
H
D
 
E
V
 
V
V
 
I
V
 
V
T
 
G
H
 
H
G
|
G
N
 
N
G
 
G
P
 
P
Q
 
Q
V
 
V
G
 
G
-
 
M
-
 
I
-
 
F
N
 
N
L
 
A
L
 
F
V
 
A
K
 
D
N
 
A
E
 
K
L
 
K
A
 
A
A
 
N
Q
 
E
V
 
K
V
 
T
P
 
A
P
 
L
V
 
V
P
 
P
L
 
F
D
 
A
W
 
E
C
 
A
G
 
G
A
 
G
Q
 
M
T
 
S
Q
 
Q
A
 
G
T
 
Y
L
 
I
G
 
G
L
 
Y
I
 
H
L
 
M
M
 
L
D
 
T
A
 
A
L
 
I
D
 
S
A
 
N
E
 
E
L
 
L
A
 
K
R
 
K
R
 
L
H
 
N
V
 
I
S
 
Q
R
 
K
R
 
D
T
 
V
A
 
L
T
 
Y
L
 
F
V
 
L
T
 
T
R
 
Q
A
 
T
R
 
I
V
 
V
D
 
D
A
 
A
A
 
N
D
 
D
P
 
P
G
 
A
F
 
F
T
 
K
H
 
N
P
 
P
T
 
T
K
|
K
P
 
P
I
 
V
G
 
G
R
 
P
H
 
F
L
 
Y
P
 
S
A
 
N
E
 
P
E
 
N
A
 
S
Q
 
V
V
 
I
L
 
V
I
 
-
D
 
-
H
 
-
G
 
-
E
 
-
T
 
-
W
 
-
Q
 
-
D
 
-
M
 
-
G
 
-
A
 
-
K
 
-
G
 
-
W
 
-
R
 
-
R
 
K
V
 
V
V
 
V
A
 
A
S
 
S
P
 
P
A
 
I
P
 
P
L
 
V
E
 
D
I
 
F
I
 
I
D
 
G
A
 
I
P
 
D
A
 
A
A
 
I
L
 
K
A
 
Q
L
 
N
I
 
V
E
 
N
A
 
N
G
 
G
F
 
C
V
 
V
V
 
C
I
 
I
A
 
V
N
 
G
G
 
G
G
 
G
G
 
G
G
 
G
I
 
I
P
 
P
V
 
T
V
 
I
R
 
I
R
 
-
E
 
Q
D
 
D
G
 
N
S
 
Q
L
 
Y
T
 
I
G
 
G
V
 
V
P
 
D
A
 
G
V
 
V
I
 
I
D
 
D
K
|
K
D
 
D
L
 
F
G
 
A
A
 
L
E
 
A
L
 
K
F
 
I
A
 
A
R
 
D
V
 
A
V
 
V
G
 
N
A
 
A
D
 
D
V
 
I
L
 
F
V
 
V
I
 
V
A
 
L
T
 
T
D
 
A
V
 
V
P
 
D
Q
 
Y
A
 
V
V
 
Y
L
 
V
R
 
D
F
 
F
G
 
N
T
 
K
P
 
P
E
 
T
A
 
Q
E
 
K
P
 
A
V
 
L
G
 
K
E
 
T
V
 
V
T
 
D
L
 
V
S
 
K
Q
 
A
M
 
L
R
 
N
A
 
N
Y
 
F
A
 
I
A
 
N
E
 
Q
G
 
D
H
 
Q
F
 
F
G
 
A
S
 
K
G
 
G
S
 
S
M
 
M
G
 
L
P
 
P
K
|
K
V
 
I
D
 
K
A
 
A
V
 
A
C
 
M
R
 
G
F
 
F
V
 
V
E
 
N
A
 
G
T
 
H
-
 
P
G
 
N
Q
 
R
V
 
S
G
 
A
I
 
I
I
 
I
T
 
A
S
 
D
L
 
L
S
 
S
A
 
K
I
 
V
T
 
E
D
 
D
A
 
A
V
 
L
H
 
K
G
 
G
Q
 
L
A
 
S
G
 
G
T
 
T
R
 
K
V
 
I
V
 
I

Query Sequence

>WP_110208549.1 NCBI__GCF_003194585.1:WP_110208549.1
MRVLMALGGNAMTNAEGRARPEDQIAAAETAMAAVAGLLEHDHDVVVTHGNGPQVGNLLV
KNELAAQVVPPVPLDWCGAQTQATLGLILMDALDAELARRHVSRRTATLVTRARVDAADP
GFTHPTKPIGRHLPAEEAQVLIDHGETWQDMGAKGWRRVVASPAPLEIIDAPAALALIEA
GFVVIANGGGGIPVVRREDGSLTGVPAVIDKDLGAELFARVVGADVLVIATDVPQAVLRF
GTPEAEPVGEVTLSQMRAYAAEGHFGSGSMGPKVDAVCRFVEATGQVGIITSLSAITDAV
HGQAGTRVVPDP

Or try a new SitesBLAST search

SitesBLAST's Database

SitesBLAST's database includes (1) SwissProt entries with experimentally-supported functional features; and (2) protein structures with bound ligands, from the BioLip database.

by Morgan Price, Arkin group
Lawrence Berkeley National Laboratory