我正在网上做一个练习,上面写着:请计算加利福尼亚(缩写CA)和纽约(纽约)(合在一起)人口超过25,000的城市的平均人口。
对于这个问题,假设出现在多个州的城市名称代表两个独立的城市。
请注意:不同的州可能有相同的城市名称。一个城市可能有多个邮政编码。
一份文件:
db. zips.findOne()
{
"_id" : "92278",
"city" : "TWENTYNINE PALMS",
"loc" : [
-116.06041,
34.237969
],
"pop" : 11412,
"state" : "CA"
}
我的查询:
db.zips.aggregate([{$group:{ _id: {state: "$state", city: "$city", zip: "$_id"
}, pop: {$sum: "$pop"}}},{$match:{pop:{"$gt":25000}, "_id.state": {$in: ["CA", "
NY"]}}}, {$group: {_id:0, avg: {$avg: "$pop"}}}])
{ "_id" : 0, "avg" : 41485.69565217391 }
但这是不正确的,我错过了什么?
我想说的是,一个城市可以有不同的邮政编码,在你的查询中,你考虑了不同邮政编码的城市。
所以,我会从你的第一组中删除zip部分:
db.zips.aggregate([
{
$group: {
_id: {state: "$state", city: "$city"},
pop: {$sum: "$pop"}
}
},
{
$match:{
pop:{"$gt":25000}, "_id.state": {$in: ["CA", "NY"]}
}
},
{
$group: {
_id:0,
avg: {$avg: "$pop"}
}
}
])
你可以尝试下面的代码来找出这个州的平均人口。随着你可以找到其他相关信息,比如哪个是最大或最小的城市,以及使用下面的聚合器在同一个查询中的人口。
db.zips.drop()
db.zips.insert({
"_id" : "1",
"city" : "C1",
"pop" : 100,
"state" : "CA"
})
db.zips.insert({
"_id" : "2",
"city" : "C2",
"pop" : 50,
"state" : "CA"
})
db.zips.insert({
"_id" : "3",
"city" : "C3",
"pop" : 500,
"state" : "CA"
})
db.zips.insert({
"_id" : "4",
"city" : "C4",
"pop" : 80,
"state" : "CA"
})
db.zips.aggregate([{$group:{ _id: {state: "$state", city : "$city"}, pop: {$sum : "$pop"} }},
{ $sort: { pop: 1 } },
{ $group:
{
_id : "$_id.state",
biggestCity: { $last: "$_id.city" },
biggestPop: { $last: "$pop" },
smallestCity: { $first: "$_id.city" },
smallestPop: { $first: "$pop" }
}
}
])
您可以在下面的链接中找到完整的信息。
http://docs.mongodb.org/manual/tutorial/aggregation-zip-code-data-set/
-$achin。